什么是RAG
RAG(Retrieval-augmented Generation)是一种自然语言查询方法,通过一个检索信息组件从外部知识源获取附加信息,馈送到LLM prompt以更准确地回答所需的问题。通过额外的知识来增强LLM 以回答问题,用以减少 LLM产生幻觉的倾向。
LLM回答用户问题时,是基于训练LLM时使用的文本数据进行的。而面对未知知识的问题,它并不能正确回答而容易产生错误的结果,即大模型的幻觉。
利用RAG减少幻觉
基于RAG技术,可以通过构建一个知识库,让LLM能够在回答问题时以这个知识库为基础,具备回答知识库中的相关内容的能力。
RAG的优势 基于RAG技术创建的知识库,可以比较便利地增删改其中的文档,可以支持更频繁的更新。
RAG的整体流程
RAG的整体流程分为两大步:
一是事先的索引丨(lndexing)也即是从私有文档构建知识库的过程;即为图蓝色虚线链路。
二是即时的查询(Querying)也即是针对已构建的知识库进行查询问答的过程。即为图红色虚线链路。先检索,然后生成。
RAG的效果
一是赋予LLM回答私有知识库问题的能力,减弱幻觉;
二是提供了回答中引用的原文出处,提高检索效率,同时便于直接对比原文确保LLM回答的准确性在智能问答、文档摘要、数据整理等领域发挥重要作用。
天津联才科技发展有限公司是一家为企业提供互联网系统技术方案和网站建设服务的企业。公司创立于2015年,主要为政府、国企、国内上市公司、国外公司提供专业的品牌服务和技术开发服务。
自2015年成立以来,我们一直在帮助企业实现具有影响力的、行业特定的品牌、官网及软件系统解决方案。我们为企业提供从需求分析、功能规划、交互设计、原型设计、系统运维的整体软件开发技术解决方案。 联才科技始终关注有前景的软件开发集成框架和培养经验丰富的技术开发团队,为我们的客户提供优异的互联网解决方案。