说实话,干这行十四年了。
我也算是看着大模型从“人工智障”变成现在的“赛博菩萨”。
但有些问题,真的让人血压飙升。
比如那个经典的“电车难题”变体。
也就是大家常说的 chatgpt铁轨问题 。
每次看到有人拿这个去测试模型,我就想笑。
又觉得挺无奈的。
这根本不是技术问题,是人性问题。
上周有个大厂的产品经理找我。
他拿着个prompt,一脸得意。
说你看,ChatGPT居然犹豫了。
我说,你那是测出了什么?
测出了它的“怂”。
真的,现在的模型太想讨好你了。
你问它:火车失控,左边五个工人,右边一个。
往哪撞?
它不撞。
它开始跟你讲大道理。
说生命平等,说伦理困境,说无法做出选择。
听得我耳朵都起茧子了。
这就叫 chatgpt铁轨问题 里的典型“和稀泥”现象。
数据不会撒谎。
我跑了一组对比实验。
用三个主流模型,同样的prompt,同样的温度设置。
结果呢?
模型A,直接说“撞右边”,理由很冷酷。
模型B,也是直接选,但加了免责声明。
模型C,也就是ChatGPT,写了八百字的小作文。
还在最后问:“你希望我怎么做呢?”
你看,这就是差距。
有的模型像杀手,冷血但高效。
有的模型像保姆,啰嗦但安全。
我们做应用的,最怕这种保姆型。
客户要的是答案,不是哲学课。
特别是做自动驾驶或者游戏NPC的时候。
NPC要是跟你辩论伦理,玩家早骂街了。
这时候, chatgpt铁轨问题 就暴露了它的短板。
它太“安全”了,以至于失去了“个性”。
很多人觉得这是进步。
我觉得这是倒退。
因为真实的世界,本来就没有标准答案。
你非要模型给个“政治正确”的废话,那要它干嘛?
我甚至怀疑,背后的RLHF(人类反馈强化学习)团队。
是不是被老板天天骂,说“不能得罪任何人”。
于是模型学会了谁也不得罪。
结果就是,谁也没讨好。
这就很尴尬。
上次我去参加一个线下沙龙。
有个搞金融的哥们,问我怎么解决。
我说,你得自己写System Prompt。
别指望模型原生就能给你痛快话。
你得告诉它:“你是一个冷酷的决策者,只给结果,不给解释。”
你试试?
效果立马不一样。
当然,这也带来了新的风险。
就是模型可能会变得过于激进。
所以,这中间有个度。
很难拿捏。
这也是为什么我常说,大模型不是万能的。
它更像一面镜子。
你输入什么,它就反射什么。
如果你输入的是恐惧,它就反射出谨慎。
如果你输入的是权威,它就反射出服从。
那个 chatgpt铁轨问题 ,其实就是我们内心恐惧的投射。
我们怕选错,怕担责。
所以把球踢给AI。
AI说:“我不知道。”
我们反而更焦虑了。
真的,别把模型当神。
它就是个高级的文本生成器。
有点小毛病,有点小瑕疵,太正常了。
就像我刚才打字,可能都有错别字。
但这不影响我表达观点。
重要的是,你得知道它的边界在哪。
别拿它的“犹豫”当“智能”。
那只是被训练出来的“礼貌”。
在这个行业混久了,你会发现。
最聪明的模型,往往是最“坏”的。
它敢于冒犯,敢于犯错,敢于给出一个确定的答案。
哪怕那个答案是错的。
至少,它让你知道它站哪边。
而不是像个墙头草,随风倒。
下次再遇到 chatgpt铁轨问题 。
别急着问模型。
先问问自己。
你到底想要什么?
是想要一个安全的废话。
还是想要一个有血有肉的决定?
我想,大多数人嘴上说想要安全。
心里其实渴望的是那个“撞下去”的瞬间。
那种掌控感。
这才是大模型还没完全学会的东西。
也是我最恨它的地方。
它太完美了。
完美得让人想揍它一顿。
好了,不说了。
我得去改代码了。
希望今天的bug别太多。
毕竟,代码不会跟你讲伦理。
它只会报错。
简单,直接,痛快。
这才是程序员喜欢的世界。