AI 幻觉：为什么大模型会"一本正经地胡说八道"？

你肯定遇到过这种情况：问 AI 一个看似简单的问题，它回答得头头是道，但仔细一查——全是错的。

这种现象叫"幻觉"（hallucination），是大语言模型最让人头疼的特性之一。

幻觉不是 bug，是模型工作原理的副产品

大语言模型的核心任务很简单：根据前面看到的文字，预测下一个最可能的词。它不是在"回忆事实"，而是在"补全文本"。

举个例子。你问"爱因斯坦的出生地是哪里？"，模型不会去查数据库，而是根据训练数据中"爱因斯坦"后面最常出现的词来生成答案。如果训练数据里"爱因斯坦"和"德国乌尔姆"经常一起出现，它大概率会答对。但如果某个冷门问题在训练数据中很少出现，模型就会靠"概率直觉"编一个听起来合理的答案。

这就是为什么 AI 在常识问题上表现不错，但在专业细节上容易翻车。

事实性幻觉：编造不存在的事件、数据或引用。比如让你查某篇论文，它给你生成一个格式完美的引用链接，但点进去是 404。

逻辑性幻觉：推理过程看似严密，但中间某一步悄悄偷换了概念。这在数学题和代码调试中特别常见——模型给出一个"看起来对"的解法，但关键步骤有漏洞。

一致性幻觉：同一次对话中前后矛盾。前面说"Python 的列表是可变类型"，后面又说"Python 列表不可修改"。

1. 让模型"展示思考过程"

不要只问答案，要求模型分步骤推理。比如"请列出你的推理步骤，每一步标注信息来源或假设"。这不能消除幻觉，但能让错误更容易被发现。

2. 交叉验证

对关键事实，让模型用不同方式回答同一问题，或者让两个独立模型回答后对比。如果答案一致，可信度更高。

3. 提供参考资料

给模型附上可靠的参考文本，让它基于给定材料回答。这比让它"凭记忆"回答准确得多。很多 RAG（检索增强生成）系统就是基于这个原理。

4. 设置"不知道"的出口

在提示词中明确告诉模型："如果不确定，请直接说不知道，不要猜测。" 这能减少模型为了"显得有用"而编造答案的倾向。

因为幻觉根植于大模型的基本架构。只要模型还在做"下一个词预测"，它就永远在概率和事实之间走钢丝。

未来的方向包括：让模型学会区分"我知道"和"我猜"，引入外部知识验证层，以及改进训练数据的质量控制。但这些都需要时间。

最务实的建议：把 AI 当作一个"很有才华但偶尔会记错"的助手，而不是百科全书。关键信息永远要二次核实。