干了9年大模型，聊聊AIGC大模型的发展阶段到底卡在哪了-outao 严选

标题下边写入一行记录本文主题关键词写成'本文关键词：AIGC大模型的发展阶段'

说实话，刚入行那会儿，我们这帮搞技术的，天天喊着“颠覆”，现在回头看，真有点脸红。那时候觉得只要参数够大，啥都能干。现在呢？客户拿着PPT来找我，问能不能用大模型把他们的客服全换了，或者把代码全写了。我一般先不接话，先问他们到底想解决啥具体问题。因为在这9年里，我亲眼看着AIGC大模型的发展阶段从最初的“瞎几把跑”到了现在的“精打细算”。

很多人觉得大模型就是聊天机器人，其实根本不是那么回事。早期的阶段，也就是2020年之前，那叫预训练大模型的萌芽期。那时候我们训练个模型，得烧掉几百万美金，显卡排队排到明年。出来的东西呢？能写诗，能画画，但逻辑一塌糊涂。你问它1+1等于几，它可能给你扯半天哲学。那时候的AIGC大模型的发展阶段，更像是在练内功，虽然招式花哨，但实战能力基本为零。

到了2022年ChatGPT横空出世，大家才反应过来，原来模型还能这么交互。这时候进入了第二阶段，也就是应用爆发期。这时候的AIGC大模型的发展阶段，重点不再是单纯堆参数，而是怎么让模型听懂人话。我们开始搞RLHF（人类反馈强化学习），让模型学会“说人话”。但这阶段有个大坑，就是幻觉问题。你让它写个方案，它敢给你编出个根本不存在的公司名字。很多公司这时候冲进去，结果发现成本太高，效果还差，最后只能烂尾。

现在，我们正处于第三阶段，也就是垂直落地和成本控制期。这才是真正的硬仗。客户不再关心你的模型有多聪明，只关心能不能帮我省钱，能不能提高那1%的效率。这时候的AIGC大模型的发展阶段，讲究的是“小而美”。我们不再去卷千亿参数，而是去卷怎么把模型塞进边缘设备，怎么通过RAG（检索增强生成）把企业私有数据喂进去，让模型不瞎编。

我最近帮一家制造业客户做质检，没用那种通用的超大模型，而是微调了一个小模型，专门识别螺丝有没有滑丝。效果出奇的好，响应速度毫秒级，成本只有通用模型的十分之一。这就是现在的趋势。别总想着用大模型干所有事，那是做梦。你得知道，AIGC大模型的发展阶段已经进入了深水区，拼的是谁能把模型和具体业务场景咬合得更紧。

还有个小细节，很多人忽略。就是数据的清洗。以前我们觉得数据越多越好，现在发现，垃圾数据进，垃圾数据出。我们团队现在花80%的时间在整理数据，只有20%的时间在调模型。这跟以前完全不一样。以前的AIGC大模型的发展阶段，是算力为王；现在是数据为王，更是场景为王。

如果你现在还想搞个大而全的平台，我劝你趁早收手。现在的机会，在于细分。比如专门做法律合同审查的，专门做医疗影像辅助诊断的。别想着一口吃成胖子。大模型不是万能药，它只是工具。你得知道怎么用它，而不是被它牵着鼻子走。

最后给点实在建议。别急着上全量部署，先搞个MVP（最小可行性产品）跑起来。哪怕功能简陋点，只要能解决一个痛点，比什么都强。另外，一定要重视数据隐私，现在监管越来越严，别因为合规问题把公司搞黄了。要是你在落地过程中遇到模型幻觉控制不住，或者成本压不下来，别硬扛，找个懂行的聊聊，有时候换个思路，能省不少冤枉钱。