内容:Deepseek哪个公司做的
很多人问我,Deepseek到底是谁家孩子?
说实话,刚入行那会儿,我也是一头雾水。
现在干了9年大模型,早就看透了这些套路。
今天不整虚的,直接说干货。
Deepseek,全称是深度求索。
它不是阿里,也不是腾讯。
它是杭州深度求索人工智能基础技术研究有限公司。
这公司老板叫梁文锋,90后,挺年轻的。
很多人好奇,Deepseek哪个公司做的?
其实它背后有个很硬的背景。
那就是幻方量化。
对,就是那个搞量化交易的幻方。
幻方在AI领域投入非常大。
Deepseek算是他们孵化的核心项目。
这点很重要,因为有钱才能烧模型。
不然哪来的算力去训练那么大参数?
我有个朋友,在一家大厂做算法。
他之前也搞不清楚这层关系。
后来去面试,被问住了。
所以搞清楚Deepseek哪个公司做的,
对你理解它的技术路线很有帮助。
毕竟量化背景,意味着它很注重效率。
不像某些公司,只堆参数不讲究实用。
Deepseek的模型,比如R1,
主打就是一个推理能力强。
而且开源,这点很圈粉。
我上周刚试了下DeepSeek-R1。
部署在本地显卡上,跑得挺顺。
只要显存够大,体验并不差。
很多小白觉得,大模型必须云端用。
其实本地跑起来,隐私更好。
而且不用付API费用,长期看省钱。
具体怎么操作呢?
第一步,下载Ollama或者LM Studio。
这两个工具对新手很友好。
不用写代码,点点鼠标就行。
第二步,去Hugging Face找模型权重。
DeepSeek的模型都在上面。
记得选对版本,别下错了。
第三步,配置环境变量。
这一步稍微有点技术含量。
但网上教程很多,照着做就行。
第四步,启动服务,开始聊天。
你会发现,它的逻辑推理确实强。
特别是写代码,bug都少很多。
当然,也不是完美无缺。
有时候它会有幻觉。
毕竟是大模型通病。
但比起某些闭源模型,
它已经做得很良心了。
再说说Deepseek哪个公司做的。
这个知识点,在面试时很有用。
HR问这个,不是想听你背书。
是想看你有没有行业洞察力。
你可以说,它是量化巨头孵化的。
所以更注重性价比和效率。
这种回答,比单纯报公司名强多了。
我见过太多人,只会说名字。
结果被问住细节,就很尴尬。
其实,Deepseek的成功,
也反映了国内AI的一个趋势。
那就是务实。
不再盲目追求超大参数。
而是追求在有限资源下,
做到最好的效果。
这对我们开发者来说,是好事。
意味着我们可以用更低的成本,
获得不错的模型能力。
不用非得去挤那些昂贵的API。
我自己现在做项目,
首选就是DeepSeek的开源模型。
稳定,速度快,社区活跃。
有问题去GitHub提issue,
官方回复也挺及时的。
这种态度,值得点赞。
最后再强调一下。
Deepseek是深度求索做的。
背后是幻方量化。
别被那些乱七八糟的谣言带偏了。
搞清楚Deepseek哪个公司做的,
只是第一步。
更重要的是,
怎么用好用它,解决实际问题。
这才是我们从业者该关心的。
好了,今天就聊到这。
希望能帮到正在纠结的你。
如果有其他问题,欢迎留言。
咱们下期见。