2025年2月28号,DeepSeek开源周的第六天,官方发布了一个很特别的东西,是V3/R1模型的推理系统介绍。和前面几天的代码库不同,这次是一篇博客文章。文章我没有细看,看可能也看不太懂,但单纯是tweeter上的帖子,已经带来相当大的震撼。
DeepSeek这个公司和早两年的OpenAI有一点像,让人眼前一亮。不管你喜欢还是不喜欢,OpenAI在这几年的AI浪潮就是先行者,旗手,领路人的角色,前期的几个工作ChatGPT、GPT4、Sora、O1都是开创性的。DeepSeek在几个月前其实在国内甚至都不被包含在所谓的六小龙里面,R1出来之后迅速出圈爆火。上个月研究了一下他们之前的一系列工作,连贯性特别强,除了坚持MOE道路,从一开始就把效率摆在了非常重要的位置。之前大家都说OpenAI力大飞砖,暴力美学,苦于国内算力难求,就感觉低人一档,但DeepSeek是一直在想怎么用更小的力把砖也飞起来,感觉有一种工程的精致美感。
开源周开源的几个东西,其实和一般开发者都没什么关系,但今天的这个推文,我感觉会很深刻地影响后面的产业走向,进而影响到广大普通人。
首先是把AI的价格打下来,你看他现在卖这么便宜,还有500%的利润率,简直是在印钞,可见降价空间之大。目前DS API的价格是8块钱人民币1M input,16块1M output,如果是没有RAG的问答,我感觉1M input/output够中高端用户用半年(红楼梦大概120万字,中文跟token大概率1比1换算,所以就是1.2Mtoken,你想一想一本红楼梦你要看多久)。未来一年,这个成本还会继续下降,我感觉降到十分之一并不困难,那么估计一个用户一年产生的推理成本可能就是几块钱人民币,基本可以忽略不计。当然这个估计可能不够准,毕竟推理模型大行其道之后模型的输出长度可能会成倍增加。但不会影响成本的数量级。
接下来是AI应用的爆发,如果上面的成本计算正确,那所有的应用都会毫不犹豫地加上AI功能,只要AI能提升一丁点产品体验,且不会伤害现有的商业模式(被普遍接受的观点是动作缓慢的谷歌就是怕影响广告)。我之前听到AI应用爆发,第一反应是像物种大爆炸一样出来很多“新”的东西,但是成本的快速下降可能更有利于原有产品利用AI进行体验提升。另一个角度是感觉直接把模型卖给消费者不是个好生意,这里有好多理由,比如:1)零星应用产生的交易金额很小,按照上面的计算一个普通人可能一年就花几块钱;2)模型间切换成本很低,一旦有更好或者更便宜的模型,用户会毫不犹豫地切换,这就特别需要加一个产品层来让用户产生粘性;3)对普通应用,目前的模型可能已经足够好了,比较难做出差异。在不严谨的语境下,AI在今年达到“90%领域超过90%的人”我认为是板上钉钉的。结合两方面原因,除了有AGI理想,卷应用是个更合理的选择。
然后就是对很多职业的影响,当ai真的在90%领域超过90%的人,那大规模失业的概率感觉在上升。离技术近的码农行业已经开始了,北美这边应届生找计算机相关工作真的挺困难。随着AI能力提升,影响面会逐渐从Junior岗位往Senior蔓延,也会从技术行业往其他行业蔓延,尤其是高时薪的知识密集型岗位,比如医生、律师等等。要么在行业里达到前10%,否则就比较危险,而且现在是10%,两三年之后可能就是5%,甚至1%。当然这个过程明面上不会很快,因为人会给机器使绊子。你端我饭碗,我跟你拼命。
“太阳底下没有新鲜事”这句话是很恐怖的,如果不是新鲜事,就意味着有被压缩到几百Billion模型参数里的可能性。所以在最后,祝大家能活出新鲜感吧。