能力越不行的LLM,越不能给他RAG
学霸留学专家菊叔·2026年4月26日

来自DiVoLog的最新报道:
RAG是什么意思?
RAG就做检索增强生成。
意思就是你给一堆东西给这个AI 模型,让它在处理具体业务之前,检索这些玩意,再生成回答。所以很多人把RAG简称为知识库。
所以这就很好理解,模型能力不行的,更加不能让他去检索增强生成了。因为它检索也检索不出什么玩意儿来。
RAG本来是要做向量的。就是把知识按照chunks切分,向量化,存到向量数据库。vector DB,维克多迪比
然后LLM通过向量数据库的检索工具,去把用户的prompts和vector db内容进行语义检索。
本来这是要解决llm模型上下文能力不行,又容易多幻觉的问题,而且让他们在限定的知识内容范围内做“精确解答”的。
可惜好像RAG越来越没有什么必要似的。好比大模型上下文越来越长。
直接把一个客服手册塞到它的系统提示里面,哪里还要什么维克多迪比和语义检索?
这个我们以后慢慢聊。
内容分类标签
Category