Deepseek公开利润率带来的影响

2025年2月28号,DeepSeek开源周的第六天,官方发布了一个很特别的东西,是V3/R1模型的推理系统介绍。和前面几天的代码库不同,这次是一篇博客文章。文章我没有细看,看可能也看不太懂,但单纯是tweeter上的帖子,已经带来相当大的震撼。 DeepSeek这个公司和早两年的OpenAI有一点像,让人眼前一亮。不管你喜欢还是不喜欢,OpenAI在这几年的AI浪潮就是先行者,旗手,领路人的角色,前期的几个工作ChatGPT、GPT4、Sora、O1都是开创性的。DeepSeek在几个月前其实在国内甚至都不被包含在所谓的六小龙里面,R1出来之后迅速出圈爆火。上个月研究了一下他们之前的一系列工作,连贯性特别强,除了坚持MOE道路,从一开始就把效率摆在了非常重要的位置。之前大家都说OpenAI力大飞砖,暴力美学,苦于国内算力难求,就感觉低人一档,但DeepSeek是一直在想怎么用更小的力把砖也飞起来,感觉有一种工程的精致美感。 开源周开源的几个东西,其实和一般开发者都没什么关系,但今天的这个推文,我感觉会很深刻地影响后面的产业走向,进而影响到广大普通人。 首先是把AI的价格打下来,你看他现在卖这么便宜,还有500%的利润率,简直是在印钞,可见降价空间之大。目前DS API的价格是8块钱人民币1M input,16块1M output,如果是没有RAG的问答,我感觉1M input/output够中高端用户用半年(红楼梦大概120万字,中文跟token大概率1比1换算,所以就是1.2Mtoken,你想一想一本红楼梦你要看多久)。未来一年,这个成本还会继续下降,我感觉降到十分之一并不困难,那么估计一个用户一年产生的推理成本可能就是几块钱人民币,基本可以忽略不计。当然这个估计可能不够准,毕竟推理模型大行其道之后模型的输出长度可能会成倍增加。但不会影响成本的数量级。 接下来是AI应用的爆发,如果上面的成本计算正确,那所有的应用都会毫不犹豫地加上AI功能,只要AI能提升一丁点产品体验,且不会伤害现有的商业模式(被普遍接受的观点是动作缓慢的谷歌就是怕影响广告)。我之前听到AI应用爆发,第一反应是像物种大爆炸一样出来很多“新”的东西,但是成本的快速下降可能更有利于原有产品利用AI进行体验提升。另一个角度是感觉直接把模型卖给消费者不是个好生意,这里有好多理由,比如:1)零星应用产生的交易金额很小,按照上面的计算一个普通人可能一年就花几块钱;2)模型间切换成本很低,一旦有更好或者更便宜的模型,用户会毫不犹豫地切换,这就特别需要加一个产品层来让用户产生粘性;3)对普通应用,目前的模型可能已经足够好了,比较难做出差异。在不严谨的语境下,AI在今年达到“90%领域超过90%的人”我认为是板上钉钉的。结合两方面原因,除了有AGI理想,卷应用是个更合理的选择。 然后就是对很多职业的影响,当ai真的在90%领域超过90%的人,那大规模失业的概率感觉在上升。离技术近的码农行业已经开始了,北美这边应届生找计算机相关工作真的挺困难。随着AI能力提升,影响面会逐渐从Junior岗位往Senior蔓延,也会从技术行业往其他行业蔓延,尤其是高时薪的知识密集型岗位,比如医生、律师等等。要么在行业里达到前10%,否则就比较危险,而且现在是10%,两三年之后可能就是5%,甚至1%。当然这个过程明面上不会很快,因为人会给机器使绊子。你端我饭碗,我跟你拼命。 “太阳底下没有新鲜事”这句话是很恐怖的,如果不是新鲜事,就意味着有被压缩到几百Billion模型参数里的可能性。所以在最后,祝大家能活出新鲜感吧。

March 1, 2025 · 1 min · Yuanhao

接近参数化的世界

每个人的世界无非是ta看到的,听到的,闻到的,尝到的,摸到的加上想到的。 今天Sora的问世让我感觉到离计算机能够模拟这个感官世界已经不远了。虽然不是精确的,但肯定可以是精彩的,令人满意的。在享受面前,谁又会在意精不精确呢。 2022年ChatGPT出来的时候有模糊的感觉:预测下一个token的任务竟然能在效果上模拟推理、逻辑、甚至扮演角色,这不就说明文字世界的一切其实是被一个概率刻画的规律主宰的吗。放在玄学语境里,就是所谓的因果,它真的存在。 这次OpenAI更近一步,“世界模型”的概念已经再清楚不过地表达他们已经接近找到用概率模型刻画世界的方法了。 Sora is able to generate complex scenes with multiple characters, specific types of motion, and accurate details of the subject and background. The model understands not only what the user has asked for in the prompt, but also how those things exist in the physical world. 时至今日,文本、图像、音频、视频都已经可以被基于概率的AI以不错的质量产生出来。这些模型几十上百GB的权重里就是一个参数化的世界。 当一切都打磨地更加完善,那下一步就可以做一个造物主,用概率的方法造一个跟现实世界很像的世界。元宇宙可能处在大爆炸前夜?

February 16, 2024 · 1 min · Yuanhao