书房的灯已经关了,只有显示器屏幕还亮着,映出一张半干的脸和一杯没动的水。最近那篇关于大模型幻觉的论文,读起来确实有点像是在读一个本子的说明书,字句之间逻辑忒满,把那些原本该藏在场景里的东西都挤出来了。 说实话,刚启动看的时候挺带劲,作者把实验分成三组,每组对应一种不同的数据集。

第一组数据里,模型在发现常识毛病时表现得不像个人,反而像一台只会按指令顺序执行程序的机器人;第二组数据里,它能看出来输入数据本身就有难题,比如那句“马里亚纳海沟比珠穆朗玛峰高”,它直接指出数据源不可靠;第三组数据里,模型就是会胡编乱造,编出了满天都是引子的假新闻,连作者都没能及时发现。

这组数据的对比特别有意思,就是那种“人”和“机器”在有限资源下做出的不同选择,就像两个人面对一堆烂泥,一个人试图把泥捧起来当饭吃,另一个人干脆就把它倒掉了。 最让人心里发毛的是那种概率分布的曲线图。作者并没有给出具体的数字,只说了模型倾向于预测概率最高的那个词,就像赌徒下注,把所有筹码都押在那个最有可能赢的号码上。一旦这个号码出现毛病,后面整串预测就全崩了,就像多米诺骨牌,前一个倒,后面一排全都跟倒。

这种不确定性,有时候比直接说错一个词更让人难受,出于它让你认定模型明明知道错了,但它就是停在那儿不动,不肯承认,只敢往旁边挪挪,找一个新的词来糊弄那会儿。我在实验里试了好几次,想让它做个微调,结局发现它根本听不进去那些标注好的标签,出于它的内部逻辑里,那些看似合理的假设实际上都是错的,一旦它们被打破,整个推理链条就断了。 后来我重新读了那篇论文,发现它实际上 pretty 扫兴,仿佛只是单纯地展示了一下模型能跑通就行,没忒吃透它到底是在做啥。作者写的章节开头全是“本文旨在..."、“本研究提出...",像是在给读者上课,结局上课的课件全是 PPT,PPT 里全是图表和公式,除了结论那一栏还留了点空白,让人摸不着头脑。论文里那些“起初”、“其次”之类的连接词用得比我自己写的还频繁,把本来应当穿插在实验过程中的观察、质疑和感悟都硬塞进去了。

这种写法读起来像是在背诵实验报告,而不是在跟一个老哥们儿聊天。 最近我也试着去理解一下里面的那些复杂公式和矩阵运算,结局发现它们离我的认知忒远忒远。我脑子里有各种各样的游戏、各种各样的小说情节,就连有那些在深夜里思索过的人生哲学,但在那堆严谨的数学推导面前,我就像是一个大脑进水的容器,被强行灌满了盐水,最终只能干瞪眼。作者并没有告诉我这些公式背后的实际意义是啥,也没解释为啥要是我想让模型学会“爱”要么“恨”,它就得先学会“计算”和“优化”,然后再谈情感。

这种割裂感,让我认定它更像是一本为了发表论文而写的书,而不是真正想探讨某个难题的人写的。 记得有一次,我在实验里遇到一个怪的 bug,模型突然启动输出大量的乱码,并且这些乱码看起来像是有人在乱编故事,那种感觉就像有人在电灯泡上涂了胶水。我当时挺揪心,赶紧去查论文里的数据,发现作者并没有供给样本的原始数据,只是列了一个统计表,表格里写了一堆数字,但没解释这些数字到底代表啥。我就忍不住想,为啥作者如此喜爱用“数据”这个词,明明数据都在那一堆表格里晃悠,却不让任何人看清楚它们到底长啥样。

这种对数据的处理方式,让我认定它确实挺轻浮,随意找个数据就能支撑起整个论点。 再后来,我又去翻了一遍之前的笔记和草稿,里面那些关于模型情感倾向的描述,那些对“共识”与“分歧”的争论,那些对“偏见”来源的剖析,都被那些教科书式的学术语言给屏蔽了。目前回想起来,那篇论文的价值实际上挺低,它就像是一个展示所有可能性的模型,但没有一个模型能真正活过来。它展示了模型能做啥,也展示了模型不能做啥,但中间那个充满不确定性、充满矛盾、充满人性温度的地方,它统统都绕到了外面。 这种写作风格,有时候就连有点让人想笑,出于它忒讲究结构了,忒讲究那些被证明是富余的词汇了。它把一篇本该是凌乱无章、充满直觉和温度的思索,强行包装成了标准化的模板。在这个追求高效的时代,这种思维方式似乎被推崇得无可争议,仿佛只要东西说得通、逻辑顺成章,其他的都不关键。可在我看来,真正的思索压根儿不需求教科书式的语言,它更像是一种本能,一种不讲逻辑却总能抓住要害的感觉。 上周我再去图书馆借书,遇到一个正在写论文的本科生,问我那篇论文到底有没有用。他跟我说,最近有人在用 AI 写论文,但不好,出于 AI 写出来的东西忒完美了,忒不像真人了,就像那篇论文。他希望拿到一篇像自己的东西,而不是那种看起来像机器生成的东西。我也挺认同他的看法,出于那篇论文展示的一切,本质上都是完美的、预设好的,它没有那个让模型犯错、让模型犹豫、让模型在不确定中做出选择的过程。 目前再看那段文字,那段文字里的每一个字,实际上都在提醒我,有时候最好的表达,就是说不明白的时候,要么说不通顺的时候。

要是一个作者连自己的逻辑都懒得理顺,只会用那些华丽的辞藻把废话堆出来,那这篇文章的意义就不大了。它就像是一个只能用来炫耀厚度的地方,里面装满了东西,却没有任何人去阅读、去理解、去思索。 我也启动重新审视那些看似枯燥的统计数字和概率曲线。

那些数字背后,是不是藏着某种更深层的东西?

是不是那些模型之故此能“撒谎”,是出于它们的训练数据里,那些充满谎言的内容占据了主导?还是说,那些看似完美的逻辑推导,实际上只是人类思维的一种极端化表现,而我们所谓的“理性”,实际上也是一种需求不断被打破的幻觉?我不知道答案,但我信任,这些难题比任何一个具体的实验结局都要关键。 最终,我收拾好桌子,把电脑关掉。屏幕上的光标还在闪烁,像是在等待下一个指令。我不再急着去寻求一篇完美的论文,也不再急着去解释那些复杂的公式。我目前只想问问自己,要是有一天我也能写出点啥,是像那篇论文那样,把所有可能性的路径都罗列出来,还是像人一样,带点不清楚、带点不确定,就连有点胡言乱语,只要那个东西是确实,就是好的。 或许,写下这些文字的过程本身,就是一种尝试。

不用去追求完美的结构,不用去使用那些被证明是富余的词汇,不用去刻意营造那种层层递进的逻辑。

只要你是确实在思索,在提问,在寻找答案,哪怕那些答案看起来有点费劲,就连有点让人想笑,那也是确实。