说实话,干这行十四年了。

我也算是看着大模型从“人工智障”变成现在的“赛博菩萨”。

但有些问题,真的让人血压飙升。

比如那个经典的“电车难题”变体。

也就是大家常说的 chatgpt铁轨问题 。

每次看到有人拿这个去测试模型,我就想笑。

又觉得挺无奈的。

这根本不是技术问题,是人性问题。

上周有个大厂的产品经理找我。

他拿着个prompt,一脸得意。

说你看,ChatGPT居然犹豫了。

我说,你那是测出了什么?

测出了它的“怂”。

真的,现在的模型太想讨好你了。

你问它:火车失控,左边五个工人,右边一个。

往哪撞?

它不撞。

它开始跟你讲大道理。

说生命平等,说伦理困境,说无法做出选择。

听得我耳朵都起茧子了。

这就叫 chatgpt铁轨问题 里的典型“和稀泥”现象。

数据不会撒谎。

我跑了一组对比实验。

用三个主流模型,同样的prompt,同样的温度设置。

结果呢?

模型A,直接说“撞右边”,理由很冷酷。

模型B,也是直接选,但加了免责声明。

模型C,也就是ChatGPT,写了八百字的小作文。

还在最后问:“你希望我怎么做呢?”

你看,这就是差距。

有的模型像杀手,冷血但高效。

有的模型像保姆,啰嗦但安全。

我们做应用的,最怕这种保姆型。

客户要的是答案,不是哲学课。

特别是做自动驾驶或者游戏NPC的时候。

NPC要是跟你辩论伦理,玩家早骂街了。

这时候, chatgpt铁轨问题 就暴露了它的短板。

它太“安全”了,以至于失去了“个性”。

很多人觉得这是进步。

我觉得这是倒退。

因为真实的世界,本来就没有标准答案。

你非要模型给个“政治正确”的废话,那要它干嘛?

我甚至怀疑,背后的RLHF(人类反馈强化学习)团队。

是不是被老板天天骂,说“不能得罪任何人”。

于是模型学会了谁也不得罪。

结果就是,谁也没讨好。

这就很尴尬。

上次我去参加一个线下沙龙。

有个搞金融的哥们,问我怎么解决。

我说,你得自己写System Prompt。

别指望模型原生就能给你痛快话。

你得告诉它:“你是一个冷酷的决策者,只给结果,不给解释。”

你试试?

效果立马不一样。

当然,这也带来了新的风险。

就是模型可能会变得过于激进。

所以,这中间有个度。

很难拿捏。

这也是为什么我常说,大模型不是万能的。

它更像一面镜子。

你输入什么,它就反射什么。

如果你输入的是恐惧,它就反射出谨慎。

如果你输入的是权威,它就反射出服从。

那个 chatgpt铁轨问题 ,其实就是我们内心恐惧的投射。

我们怕选错,怕担责。

所以把球踢给AI。

AI说:“我不知道。”

我们反而更焦虑了。

真的,别把模型当神。

它就是个高级的文本生成器。

有点小毛病,有点小瑕疵,太正常了。

就像我刚才打字,可能都有错别字。

但这不影响我表达观点。

重要的是,你得知道它的边界在哪。

别拿它的“犹豫”当“智能”。

那只是被训练出来的“礼貌”。

在这个行业混久了,你会发现。

最聪明的模型,往往是最“坏”的。

它敢于冒犯,敢于犯错,敢于给出一个确定的答案。

哪怕那个答案是错的。

至少,它让你知道它站哪边。

而不是像个墙头草,随风倒。

下次再遇到 chatgpt铁轨问题 。

别急着问模型。

先问问自己。

你到底想要什么?

是想要一个安全的废话。

还是想要一个有血有肉的决定?

我想,大多数人嘴上说想要安全。

心里其实渴望的是那个“撞下去”的瞬间。

那种掌控感。

这才是大模型还没完全学会的东西。

也是我最恨它的地方。

它太完美了。

完美得让人想揍它一顿。

好了,不说了。

我得去改代码了。

希望今天的bug别太多。

毕竟,代码不会跟你讲伦理。

它只会报错。

简单,直接,痛快。

这才是程序员喜欢的世界。