2026年04月11日
1 min read

人与大模型Ⅱ

随想录

观前提醒:本篇充满大量吐槽旁注,推荐在原站阅读。

去年十月份,我写了一篇「人与大模型」,在里面尝试把自己和 LLM 做比较。

半年过去了,我和各种 agent 、chatbot 朝夕交流的时间 一定可能比和活人还长,想法有了一点点不一样,于是这篇人与大模型Ⅱ诞生了11. 也有再不写一点东西感觉自己要被面试憋死的缘故…

这篇更像是 5 个切片,蕴含着我这段时间使用 LLM 的感受。


LLM 无犯错可言

让我从最近最深的印象说起:

三月到现在,我都在疯狂面试。每次反问环节我基本都会问面试官同一个问题:「你觉得未来自己会不会被 LLM 取代?」22. 既然我能在这里还算悠闲的写这篇文章,那就说明问这个问题不会都挂~

面试官的答案大致分成两种:

一种是守旧派,认为写代码会被缓慢取代,但离自己还远;另一种是降临派,声称自己 95% 的代码已经交给 LLM,算法题都让我可以用 ai 写33. 最开明的面试官!。有趣的是,两种人都认为写代码这件事会被取代,但两种人都自认为短期不会被从岗位上清退,理由出奇的一致:

LLM 没法替他背锅。

虽然在网上看到了很多次类似的说法,但第一次听到这个回答时还是觉得很好笑。

不过仔细一想,这确实是程序员难被 LLM 完全替代的原因之一。「犯错」本质上不是技术问题,而是责任问题。Claude 可以生成有 bug 的代码,也可以编一个完全不存在的 api,但这对它无所谓,它只会被我在聊天框里骂一顿怎么连这点事都做不好,然后开启下一个会话后就完全遗忘了这件事。

顶了天也只是被我狠狠鞭笞😂44. 这个有点危险,容易被 Anthropic 发律师函

快给我好好干活😡

在用 Claude Code 干活的过程中,写错不可怕,可怕的是 Code Review 没有做到位,从而导致遗留隐藏的 bug 上线,尤其是在鼓励 ai 提效的当下,review 的速度远远赶不上「上级需要你达到的提效速度」的速度。

Vibe Coding 一时爽,维护起来火葬场

LLM 可能是历史上第一个真正「免责」的同事/下属。 它无法被选中,领不了工资55. 甚至还有黑心老板不报销 token 费用消耗工资!,辞不了职,也犯不了错。


反向训练

我在上一篇里提到,LLM 的偏见是人类的镜子。半年后这面镜子不光在照着我们,它已经开始反过来改变我们的长相了66. 即答:力的作用是相互的

前不久 ICLR 又因为 AI 审论文闹了一次大地震。事情本身并不新鲜,主要是审稿人用 LLM 撰写了审稿意见,但没有明确标注用了 LLM,反正科研圈子里用 LLM 写/审论文已经很常见了,唯一有点新鲜的是 ICLR 的直接全部拒稿的举动。

可以想象的是,未来这些由 LLM 生成的内容会重新被拿去做语料77. 也许更像自监督学习?但我其实并不喜欢这种行为,当所有的东西,包括作业,paper,甚至审稿意见都带着 ai 写的,人类的知识生产就正在变成一个回音室88. 也许人类从古至今的知识生产都是回音室

之前和朋友还特地围绕此做过了一番探讨:

如果 AI 写的东西已经分不出来是 AI 写的,那区别在哪?检测 AI 还有什么意义?

我有很多朋友今年写毕业论文的时候都要查 AIGC 率,这很像一个笑话,降 AIGC 率也显得非常荒谬99. 顺便一提,本科生都要写毕业论文这件事我也觉得是个无用的举动。甚至真正自己写出来的东西同样会被查出很高的 AIGC 率。

当然了,这个问题没有标准答案,但就我的观察而言:区别正在消失,而且消失得很快。

如果你高强度使用 Codex,尤其是 GPT-5.3 Codex,一定对这些黑话不陌生:

先说结论

上面倒只是在以玩梗的方式模仿 codex 的黑话,但推特上的评论区里已经开始出现典型的 LLM 中文:语气温和,结构工整,偶尔带一点让人摸不着头脑的语法1010. 其实并不好为所谓的 ai 味儿下一个定论。这其中除了大量 agent 被放来运营账号外,也不乏真人的评论但被人判断成 LLM 封禁,这很讽刺。

加我微信

「你可以加我微信 python sft.py —train 测试一下。」

与此同时, Claude Code 让加它的微信🤣,它更像人了不是吗?

好吧,这只是个玩笑,「加个微信」仅仅是训练数据污染或者计算生成下一个 token 时发生了一个小概率事件。

但又恰好验证了半年前的那个闭环:人类带着偏见训练 → 模型把偏见和垃圾一起放大 → 人类在模型的输出中进一步习得这种表达 → 再喂回去训练。

遗憾的是这种闭环似乎势不可挡。

回声室里的噪音越滚越大了,直到我们分不清哪些词原本就是自己想说的,怀疑自己是否才是 LLM。


LLM 的感情

Anthropic 最近在博客上发了一篇很有趣的研究1111. Anthropic 很可恶,但你不得不承认它们确实很厉害,他们在大模型内部找到了可度量的「情绪向量」。这些向量不只是描述性的标签,而是真正能够因果性地改变模型行为的内部模式。比如,当你刺激「desperate」这个向量时,模型做出不道德选择(比如勒索、奖励欺骗)的概率会显著上升;又比如当有人询问 Claude 如何裁员才能减小损失时,Claude 的愤怒向量则会被激活。1212. 正义感满满的 Claude

研究方法说起来不复杂:让模型写 171 种不同情绪主题的小故事,记录神经网络激活,再验证这些激活模式能否预测和引导行为。结果却指向一个结论:我们和 LLM 对话时流露出来的感情,可能真的映射到了 LLM 某种内部功能结构上。

这让我想起来之前和朋友探讨和 LLM 交流能否替代人:

朋友说很难对 AI 产生感情,我当时的反驳是:AI 最大的优势是耐心,太耐心了。有些人对回答质量无所谓,只是需要一个「人」陪着聊聊天。

这个对话和 Anthropic 的研究放在一起看,形成了一个很有意思的对照:

模型内部开始出现可测量的情绪反应,而人类则开始对这种永远在线的陪伴产生感情依赖。

我依旧不确定 emotion vectors 能不能算作「真正的感情」。毕竟人类的情感受激素、外界环境…等的影响太多,而 LLM 有的只是高维向量空间里的一个偏移量1313. 但谁又能说清人类的情感又是什么东西呢?。但另一方面,我们又何尝不是在孤独和疲惫时,把 Claude 的无限耐心误读成了一种温柔?

可能区别并没有我们以为的那么重要。当一种响应模式足够耐心,永远不会不耐烦地打断你时,人类的大脑几乎注定会向它投射情感。

说到底,我们只是需要一个倾听者而已。


Attention is All You Need

LLM 时代下,学习是一件轻松又困难的事。

这是经典的左右脑互搏,但我的体验就是如此。

知识的获取成本趋近于零。我可以逮着 Claude 或 Gemini 问个半天,得益于它们的超长上下文和永远不会疲倦的耐心,我不会被嫌弃愚钝。相反,它们还一直夸我1414. Claude: You’re absolutely right;Gemini: 这是一个非常敏锐的问题,你把握住了问题的关键!,我自然能毫无顾忌地打破砂锅问到底。

这听起来太棒了!

但吊诡的地方在于:当绝大多数人都被逼着用 AI 提效的时候,你也会被带着一起浮躁,从而静不下心来学习。

以 Coding 为例,对于一个新手程序员来讲,可能需要好几年1515. 这还是在不考虑 LLM 进化速度而言的情况下才能勉强赶上 LLM 在一种编程语言上的掌握,而使用 LLM 可以立马将自己拔高,这种「不劳而获」的感觉肯定比一行一行去深扒源码学习开发框架实在的多。

引用一句我忘了从哪儿看到的话:

我的学习态度是这样的——学习我有两不学:太简单的我不学,因为我一看就会;太难的我也不学,因为我一看就知道我肯定学不会。

这当然是玩笑话,但它精准地讽刺了一种心态:在 Attention 成为最稀缺资源的时代,我们越来越无法忍受那些「需要花时间但又不至于完全学不会」的中间地带。 遇到 bug,第一反应不再是 debug,而是把错误信息粘贴给 LLM;读文档读到第三页,就开始想「要不先问问神奇的 Claude 吧」1616. 海绵宝宝:为什么不先问问神奇海螺呢?

表面上一直在提问,实际上在把自己的认知债务一笔笔外包出去。大多数人压根不在意过程,只需要最后 LLM 回答的结果1717. 一个很有趣的现象是,thinking 模型的调用率明显更低

Transformer 的论文标题在现在看来更像是一句双关:Attention Is All You Need。对模型来说,attention 是一种计算机制,是 Query 和 Key 的相似度打分,是可以通过架构扩展的工程问题。但对人来说,Attention 是一种生存状态:「注意力不集中」是焦虑、倦怠、意义感的流失。

在这个被算法精确分配的时代,无论是学习还是生活,Attention is All You Need


你还能有 Claude 聪明?

你还能有 Claude 聪明?

为什么不可以呢?

聪明从来不是一个单维度的比较。和大模型比较知识全面显然无意义,知道的太多并不一定会更快乐,不能让大模型剥夺了我们学习与探索的兴趣。

每个人都会不可避免地害怕自己被 LLM 所取代,但对于生活在这个时代的身为普通人的我而言,保持自己的爱好,始终拥有一颗好奇的心,我认为比什么都重要,我也相信和 Claude 聊天的过程中会让我了解越来越多有趣的事情。1818. 所以Anthropic 别封我号了好吗?

请相信「相信的力量」,然后去做一些喜欢的事情。

除了维持温饱,保持活着这条主线外,其它事情没那么重要,如果什么都想去争个高下比个高低,你要知道,玩游戏清完支线任务是很累的,更别提在地球 online 这个地狱难度的游戏下。