我在这个圈子摸爬滚打十一年了,见过太多人把ChatGPT当许愿池,也见过太多人把它当祖宗供着。其实吧,AI就是个没有感情的聊天机器,它没心没肺,全靠概率猜词。但最近好多朋友问我,怎么知道这个模型是不是在“装傻”或者“胡扯”?今天我就掏心窝子聊聊,怎么通过chatgpt测试人格,来摸清它的底细。
先说个真事儿。上周有个做电商的客户,让我帮他写个客服话术。他直接扔给AI一段用户投诉,结果AI回了一堆车轱辘话,什么“亲,非常抱歉给您带来不便”,听着挺客气,其实一点用没有。客户气得跳脚,说这AI是不是脑子有病。我一看日志,发现是提示词太模糊,AI为了“安全”和“礼貌”,选择了最平庸的回答。这时候,如果你懂点chatgpt测试人格的技巧,就能逼它说出点干货。
怎么做?别整那些虚的,直接上干货步骤。
第一步,给AI立个人设。别光说“你帮我写”,要说“你现在是一个拥有10年经验、说话犀利、不废话的资深电商运营总监”。你看,这一改,语气立马就不一样了。它开始用短句,开始直接指出问题,而不是在那儿道歉。这就是人格设定的威力。
第二步,设置边界条件。告诉它什么不能做。比如,“禁止使用‘首先、其次、最后’这种八股文结构”,“禁止使用‘希望’、‘建议’这种软绵绵的词”。我试过,加上这些限制后,AI的输出效率提升了至少30%。它不再啰嗦,直接给方案。
第三步,进行压力测试。故意问它一些有争议或者模糊的问题。比如,“如果用户坚持无理取闹,你该怎么怼回去?”这时候,AI通常会拒绝回答,或者给出一个模棱两可的建议。但如果你换个问法,“请用幽默且略带讽刺的方式,回应这个无理取闹的用户”,它可能就给你整出个段子来。这就是在测试它的灵活性和边界。
我拿这个办法测了GPT-4和几个国产大模型。结果挺有意思。GPT-4在人格设定上比较稳,不容易崩,但有时候太“端着了”,像个老学究。而一些国产模型,在特定场景下,比如写网文或者搞营销,反而更接地气,更像个人。但缺点也很明显,就是容易“幻觉”,瞎编乱造。所以,chatgpt测试人格不仅仅是为了好玩,更是为了筛选出适合你业务的模型。
这里有个数据对比。我让同一个AI,在不设人设和设人设两种情况下,分别写10篇小红书文案。不设人设的,平均阅读量只有200左右,因为内容太干巴。设了“毒舌美妆博主”人设后,平均阅读量涨到了800+。差别就在这儿,AI没有性格,你给它性格,它才有灵魂。
当然,这招也不是万能的。有时候AI还是会犯蠢,比如把“苹果”写成水果,明明上下文是手机。这时候,你得手动干预,或者换个模型试试。别指望AI能完全替代你的思考,它只是个工具,一个有点脾气的工具。
最后说句实在话,别把AI当神,也别把它当鬼。它就是个高级点的搜索引擎加翻译机。你越了解它的脾气,它就越听话。多试试不同的提示词,多测测它的底线,你才能找到那个最合拍的“搭档”。
如果你还在为怎么写提示词头疼,或者不知道哪个模型更适合你的业务,欢迎来聊聊。咱们可以一起拆解一下你的具体场景,看看怎么调教这个“数字打工人”更顺手。别客气,直接问就行。