- Java77
- 数据库44
- 计算机基础43
- 技术文章精选集25
- 分布式24
- AI 应用开发22
- 系统设计18
- 高性能15
- 框架13
- AI11
- 开发工具11
- 走近作者10
- 知识星球10
- 高可用10
- AI 编程实战9
- 面试准备9
- 开源项目8
- 计算机书籍7
- 走近项目5
- 代码质量4
- AI 编程技巧3
- AI 编程1
- 程序人生1
- Java面试指北1
AI Agent 面试最容易出现两种极端:一种是把 Agent 讲得像“全自动数字员工”,什么都能自己规划、自己执行;另一种是把 Agent 讲得像“几个 Prompt 串起来”,完全看不出和普通工作流有什么区别。
真正好的回答要落到中间:Agent 的核心不是神秘的自主意识,而是一套围绕大模型构建的任务执行系统。它要有运行循环、上下文供给、记忆机制、工具调用、安全边界、失败恢复和评测闭环。
这份 AI Agent 面试题根据 AI 专栏现有文章整理,重点不是让你背“Agent 是什么”,而是帮你学会这样回答:
- Agent 为什么需要 Loop?
- Agent 为什么离不开 Context Engineering?
- Memory、Tools、MCP、Skills 分别解决什么问题?
- 什么时候应该用 Workflow,而不是直接上纯 Agent?
- Agent 上生产后,怎么控制成本、风险和不确定性?
AI 应用开发面试和传统后端面试不太一样。
传统后端面试更多围绕 Java、JVM、并发、MySQL、Redis、消息队列、分布式和系统设计展开。AI 应用开发面试除了这些基础,还会继续追问:
- 大模型 Token 是怎么计算的?上下文窗口越大越好吗?
- Function Calling 和 MCP 有什么区别?工具调用怎么做权限控制?
- RAG 召回率低怎么排查?Chunk 怎么切?Rerank 解决什么问题?
- Agent 的 Memory 怎么设计?长任务上下文溢出怎么办?
- 如何设计一个生产级 AI 应用?模型网关、评测、可观测怎么做?
AI 系统设计题和传统后端系统设计很像,但多了一个特别麻烦的变量:大模型。
传统服务通常遵循确定性的输入输出,出了问题可以按日志、链路、数据库状态逐步定位。AI 应用不一样,模型输出有随机性,Prompt 会影响行为,RAG 证据会影响答案,工具调用可能失败,供应商可能限流,评测还不能只靠单元测试。
所以,AI 系统设计面试真正考的是:你能不能把一个 Prompt Demo 设计成稳定、可观测、可评测、可回滚、可治理的生产系统。
这份 AI 系统设计面试题根据 AI 专栏现有文章整理,适合 2 年以上开发者复习。建议你按这条主线准备:
很多同学准备大模型面试时,第一反应是去背 Transformer、Attention、RLHF 这些词。不是说这些不重要,但对大部分后端转 AI 应用开发、AI 工程应用岗位来说,面试官更关心的是另一件事:
你是不是真的理解大模型调用链路里的工程约束。
比如 Token 为什么会影响成本和延迟?上下文窗口为什么不是越大越好?Temperature 为什么会影响结构化输出稳定性?Function Calling 为什么不能让模型直接执行真实业务操作?这些问题看起来基础,答不好就会暴露一个信号:你可能只是调过 API,还没有把大模型当作生产系统里的一个不稳定外部依赖来治理。
RAG 是 AI 应用开发里最容易被低估的模块。
很多人以为 RAG 就是“文档切块 -> 转向量 -> 存向量库 -> 检索 -> 拼 Prompt”。Demo 阶段这么理解没问题,但一到真实业务,问题马上变复杂:文档解析不干净、Chunk 切碎了语义、Embedding 模型选错、召回结果不准、权限过滤漏了、知识库更新后旧版本还在、模型拿到证据却没有正确回答。
所以,RAG 面试真正考的不是“你会不会接向量数据库”,而是:你能不能把一个检索增强生成系统拆成可定位、可优化、可评测、可更新的工程链路。

