refactor(chat):重构AI助手功能并集成文档读取能力
- 移除原有的手机号识别与消息发送逻辑 - 删除RabbitMQ和邮件相关配置及代码 - 引入PDF、HTML、JSON等多种文档读取器 - 集成向量存储与检索功能支持问答 - 更新Spring AI依赖并调整内存存储方式 - 添加新的工具类用于保存文档到向量库- 修改提示词模板去除强制附加句规则 - 调整Cassandra和PgVector相关配置项- 新增多种文件格式读取组件实现类
This commit is contained in:
@@ -0,0 +1,29 @@
|
||||
package com.hanserwei.chat.reader;
|
||||
|
||||
import org.springframework.ai.document.Document;
|
||||
import org.springframework.ai.reader.tika.TikaDocumentReader;
|
||||
import org.springframework.ai.transformer.splitter.TokenTextSplitter;
|
||||
import org.springframework.beans.factory.annotation.Value;
|
||||
import org.springframework.core.io.Resource;
|
||||
import org.springframework.stereotype.Component;
|
||||
|
||||
import java.util.List;
|
||||
|
||||
@Component
|
||||
public class MyTikaPptReader {
|
||||
|
||||
@Value("classpath:/document/XX牌云感变频空调说明书.pptx")
|
||||
private Resource resource;
|
||||
|
||||
public List<Document> loadPpt() {
|
||||
// 新建 TikaDocumentReader 阅读器
|
||||
TikaDocumentReader tikaDocumentReader = new TikaDocumentReader(resource);
|
||||
// 读取并转换为 Document 文档集合
|
||||
List<Document> documents = tikaDocumentReader.get();
|
||||
|
||||
// 文档分块
|
||||
// 使用自定义设置
|
||||
TokenTextSplitter splitter = new TokenTextSplitter(1000, 400, 10, 5000, true);
|
||||
return splitter.apply(documents);
|
||||
}
|
||||
}
|
||||
Reference in New Issue
Block a user