刚拿到b站大语言模型实习offer的时候,我整个人是懵的。朋友圈里都在晒工牌,说是在搞最前沿的LLM,每天就是调参、跑实验,听起来高大上得不行。但真进去待了两个月,我想说句大实话:这活儿,没你想的那么光鲜。

先说招聘渠道。很多人盯着牛客网或者Boss直聘,其实b站内部内推成功率最高。我那个学长,直接甩给我个内推码,简历都没怎么改就过了。这里有个细节,b站招大模型实习生,比起985硕士,他们更看重你的项目落地能力。别整那些虚头巴脑的Paper,把你之前做过的RAG系统、Prompt优化案例整理清楚,尤其是你能解决什么实际业务痛点,这才是面试官想听的。

再聊聊工作内容。你以为进去就是训练千亿参数模型?太天真了。大部分时间,你都在做数据清洗。对,你没听错。清洗数据。我们要处理的是弹幕、评论、视频标题,这些数据噪点多得吓人。比如,我们要清洗一批用于微调的对话数据,得人工标注哪些是垃圾广告,哪些是有效互动。我上个月光看标注数据就看了几千条,眼睛都快瞎了。虽然枯燥,但这才是大模型落地的基石。没有高质量数据,模型就是废柴。

关于薪资和待遇,我也得扒开说说。网上传什么日薪800、1000,那是头部大厂的核心组。b站这边的实习薪资,大概在每天300-400左右,看你的学历背景定级。别嫌少,b站的食堂是真的香,早中晚三餐几乎免费,而且菜品丰富,省下的饭钱比工资还多。另外,加班不算太狠,一般晚上9点前能走,偶尔为了赶项目上线会熬到凌晨,但会有打车报销。这点比某些996大厂要人性化得多。

不过,坑也不少。第一个坑,是导师制。b站的导师制度有时候流于形式,如果你运气不好,碰到个忙得没空理你的导师,那你基本就是自生自灭。你得学会“厚脸皮”去问问题,别等着别人喂饭。第二个坑,是技术栈更新太快。今天还在用PyTorch,明天可能就要上Megatron-LM,你得自己主动去学,没人有空手把手教你。第三个坑,是转正机会。说实话,b站的大模型岗位HC(Headcount)并不多,转正率大概在20%-30%左右。别把希望全押在转正上,把这当成一个跳板,积累项目经验,哪怕最后不留用,你这段经历写在简历上,去面试其他大厂也够用了。

再说说面试技巧。技术面主要问基础,比如Transformer架构、Attention机制、常见的微调方法LoRA、P-Tuning等。别背八股文,要理解原理。比如,为什么LoRA能生效?因为它利用了梯度的低秩特性。这种深度的理解,比背下公式更重要。业务面则会问你对b站生态的理解,比如大模型怎么帮UP主生成标题,怎么优化搜索推荐。你得结合b站的特点来回答,别拿通用场景的答案糊弄。

最后,给想申请b站大语言模型实习的同学几点建议。第一,准备好你的GitHub,代码能力是硬通货。第二,关注b站技术公众号,了解他们最近在搞什么新项目。第三,心态要稳,实习就是来学习的,别太在意一时的得失。

总之,b站大语言模型实习是个不错的起点,尤其适合那些想在大模型领域深耕的同学。虽然累,虽然枯燥,但你能接触到真实的大规模数据和处理流程,这是在学校里学不到的。别被网上的光环迷了眼,脚踏实地,做好每一行代码,洗好每一条数据,这才是正经事。

希望这篇干货能帮到正在迷茫的你。如果有具体问题,欢迎在评论区留言,我看到都会回。毕竟,大家都不容易,能帮一把是一把。