能源知识
vsport网站,浙江华云清洁能源申请基于大模型知识库的集成式检索对话专利采用新式DFRAG技术双重过滤
金融界2024年12月9日消息,国家知识产权局信息显示,浙江华云清洁能源有限公司申请一项名为“基于大模型知识库的集成式检索对话方法vsport网站,、系统及介质”的专利,公开号CN 119088915 A,申请日期为2024年8月。
专利摘要显示,本发明涉及集成式检索对话领域,尤其涉及基于大模型知识库的集成式检索对话方法、系统及介质,步骤包括S1:知识库预处理,对知识库标准化处理,包括对知识库中文本的清洗、分词、词干提取;S2:进行双重过滤,使用稀疏检索器和密集检索器对预处理后的文档进行检索,返回N篇文档;S3:合并初步结果,从稀疏检索器和密集检索器中各自选出相似度高的p篇文档;S4:运用RRF算法,对所有选出的文档执行计算,并将得到的分数相加进行计算;S5:根据RRF计算的新排名,返回最终的文档列表。本发明的优点在于采用新式DFRAG技术使用密集检索器双重过滤,对检索结果进行精细调整。