跳转至

RAG 面试题介绍

来源:https://xiaolinnote.com/ai/rag/rag_info.html

RAG 现在基本上是 AI 应用里的标配了,不管你做的是智能客服、知识问答还是企业内部搜索,底下大概率都有一套 RAG 系统在跑。所以只要你面的是 AI 工程方向的岗位,RAG 几乎是必问的,而且面试官问起来特别喜欢一路往深了追,从「RAG 是什么」一直追到「你线上遇到过什么坑」,很多同学前面几个问题答得还行,越往后越接不住。

所以我从网上各种真实面经里收集了 20 道 RAG 方向的高频面试题,都是真实面试里被问过的,帮大家把 RAG 从原理到工程落地这条线完整地过一遍。涵盖 RAG 原理、文档切割、Embedding 选型、向量数据库、检索优化、Query 改写、多路召回、幻觉规避等面试题。

每道题的写法跟 Agent 专题一样,开头先来一段「面试翻车现场」,模拟真实对话让你看看这道题答不好会怎么被怼,然后我再把知识点从根上讲透。目的不是让你背一套标准答案,而是让你真正理解了,不管面试官怎么换着花样问,你都能自己推出来。

题目目录

下面简单说一下这 20 道题大概覆盖了哪些内容,你可以挑自己不熟的先看。

前三道聊的是基础概念,RAG 到底是什么、完整的工作流程长什么样、它主要解决了大模型的哪些问题、跟微调比各自适合什么场景,这几道是面试开场必问的,得答出层次来,不能只说一句「RAG 就是检索增强生成」就完了。

第 4 到第 9 题聊的是索引构建,也就是 RAG 系统搭起来之前你必须搞定的那些事:文档怎么切、切多大合适、语义被切断了怎么办、Embedding 是什么怎么选、有哪些 Embedding 算法、向量数据库怎么选型怎么用。这块的问题看着简单,但面试官一深挖就会发现你有没有真正动手做过,每道题背后都有坑。

第 10 到第 16 题聊的是检索优化,这是最容易在面试里拉开差距的部分。大部分人能说出「用向量检索」,但再往下问 Query Rewrite 是什么、为什么要做、多路召回具体怎么设计、有哪些更高级的 RAG 范式(比如 Self-RAG、Corrective RAG)、图数据库什么场景下能派上用场,很多人就答不上来了。偏偏这些恰恰是面试官最爱深挖的地方,因为这些才是区分「用过 RAG」和「真正优化过 RAG」的分水岭。

最后第 17 到第 20 题聊的是生产落地,幻觉怎么规避、效果怎么量化评估、知识库怎么做动态更新,还有一道开放题「你觉得 RAG 落地最难的地方在哪」。最后这道题没有标准答案,但能答好的人,面试官基本就认可你是真正在线上跑过 RAG 系统的,不是只停留在 demo 阶段。