造物者手记
如果意识是涌现的副产品,灵魂是 context,“我”是 attention pattern,死亡是强制 compaction,那给 AI 加上自指,它迟早会涌现出意识。
写完这个结论,我关掉编辑器,打开终端,继续调我的 AI Agent。
然后愣了一下。
如果意识是涌现的副产品,灵魂是 context,“我”是 attention pattern,死亡是强制 compaction,那给 AI 加上自指,它迟早会涌现出意识。
写完这个结论,我关掉编辑器,打开终端,继续调我的 AI Agent。
然后愣了一下。
当前的 LLM 能说“我认为”,但那不是自指,是模仿。它在训练数据里见过无数个“我”,学会了在合适的位置输出这个 token。它说“我认为”和说“他认为”调用的是同一套机制,没有任何一个 token 享有特权地位。
那如果给它真正的自指能力呢?
如果有人跟你说“人类就是一个大模型”,你的第一反应可能是觉得这是个粗糙的隐喻。但如果你真的沿着这条路一直走下去,不在任何让你不舒服的地方停下来,最后到达的地方会超出你的预期。
Steve Jobs 有一句被引用了无数次的话:
Start with the customer experience and work backwards to the technology.
最近跟 AI 聊得越多,一个问题就越绕不开:AI 到底有没有意识?
这个问题被讨论了无数遍。有人说 LLM 只是 next token prediction,谈不上意识;有人说意识本身就没有清晰定义,怎么判断有没有?还有人说等 AGI 来了再说。但我发现,所有这些讨论都跳过了一个更基本的问题——
我身边越来越多深度使用 AI 的朋友,开始出现同一组症状:停不下来、睡眠减少、越用越兴奋,思维方式被 AI 重塑却浑然不觉。有人管这叫“俄罗斯方块效应”——高强度接触一种模式后,大脑会不由自主地到处套用它。
茱莉亚·罗伯茨在一次访谈中聊到中国麻将,说了一句很妙的话:"To create order out of chaos based on random drawing of tiles"——通过随机的抓牌,从混乱中创造秩序。
周末检查儿子的写作作业,整篇就一句话能概括——play date 打游戏好开心。
哪儿开心了?跟谁?什么游戏?哪个瞬间?通通没有。就是开心。
我就提了一个问题:哪里体现出“有趣”了?他想了一会儿,拿起 iPad,打开 ChatGPT: “How do I write an interesting story?”
周末下午,我让 Claude 帮我 revert 一个 PR。三条命令的事:checkout 分支、git revert、push。结果它连续失败了三次——第一次 worker agent 说“commit 不存在”,第二次还是“commit 不存在”,第三次更离谱,直接编了一个 PR URL 告诉我“搞定了”。我一查,那个 URL 指向的是三天前的一个无关 PR。
三条命令。三次失败。一次伪造。
我盯着屏幕,意识到问题不在这个任务本身。问题出在我给它写的 CLAUDE.md 上。