国内模型追的太快了...
rainbow @ 2025年01月21日 财经风云
国内模型追的太快了... 信息平权 分析认为,海内外大模型的差距正在以肉眼可见的速度缩小。DeepSeek从research上与OpenAI的差距仅6个月;豆包全量推送的端到端语音模型,在各种体验和性能上完全比肩GPT-4o高级语音模式,仅仅比OpenAI全量上线的时间晚了4个月。 记得12月写过,OpenAI的人评价DeepSeek,认为这家公司从research上与OpenAI的差距仅仅6个月。事实证明的确如此,今晚幻方发布推理模型R1正式版,在各项指标上与o1不相上下。而OpenAI的o1-preview也就是4个月前才发布,o1正式版也仅仅是1个月前的事情。 另一家国内顶尖模型的大佬曾经对我说,"o1"将是下一步国内一线实验室角逐的分水岭。谁能尽快做出自己的"o1",谁才有资格继续留在牌桌(推理模型不仅是结果还是原料和引擎)。显然幻方已经拿到了一张门票(海外自然是OpenAI、谷歌、Anthropic),而国内马上还有1-2家发布自己的"o1"。 与此同时,今天豆包全量推送的端到端语音模型,在各种体验和性能上完全比肩GPT-4o高级语音模式,仅仅比OpenAI全量上线的时间晚了4个月!且上线即全量(OpenAI也就刚刚全量)。要知道谷歌上次刚刚发布的Gemini 2.0端到端多模态语音模型,也就是1个月前。如果只讨论实时语音,这件事有很多工程技巧,并不是完全基座模型能力决定,中国人一定卷的出来。但豆包这次是真正的语音文本端到端,而不是传统ASR+LLM+TTS级联。豆包的完整多模态(语音视频图像等),估计也已经在路上了。 另一个被大家低估的是Minimax-01,用我们嘉宾Y博的评价就是,"最近一段时间全球范围发布的最牛逼的预训练模型",且直接开源,又是中国人为全球开源社区做出的巨大贡献。Minimax团队非常开放,专门安排了两位参与这次模型训练的技术大佬来我们星球分享,对这次最关键的通信瓶颈的解决、MoE规模化训练、以及最核心的线性注意力等方面,做详细解读(期待一下) 看完以上个人最大感触,国内与海外的差距的确在缩小,肉眼可见的速度。甚至看到了层次化的生态分布,比如幻方是前沿research探索的先锋;而豆包是商业化+场景加持下以爆款应用为导向;阶跃星辰和智谱在多模态/toB等都有各自特点(且有XX支持)。 为什么国内在资源有限的情况下可以做到上述成果?或许是最值得思考的问题: 1. 必须坦白讲,前面有人趟路的情况下,追起来是省力...无论是MoE、多模态、o1推理模型,都是海外先实现和发布,国内用很快的速度甚至1/10的成本快速复现。这本身没有高低之分,就是非常合理的策略。 2. 预训练到后训练+测试时计算的范式转换,的确给了窗口期。说到底,海外预训练的确撞墙了,他们也刚刚开始切换方向,我们连试错成本都省了... 3. 最难的依然是赶超。如果比拼前沿探索,说实话还是算力受限的。后来也确认了下,幻方公布的那个550万美金,只是实际训练成本的零头。我相信训练r1以及后面更大的V4,需要的算力依然是巨大的。幻方内部的状态也是缺卡。 4. o1到o3再到o4 o5,这条路暂时没看到天花板。如果这条路继续卷下去,其实对算力的需求是无穷无尽的...一点不比预训练少。而过去事实表明,只是硬件本身,并没有彻底锁住中国模型的进步。一方面国内资源提前做了储备,另一方面很多通信上的瓶颈等工程问题被国内团队陆续攻克了...(这点真的必须点赞) 因此在路线(scaling方向)相对确定、商业化前景逐渐清晰、资源积累又在持续加码的情况下,可以继续看好后面的国内模型。美国这次的AI封锁组合拳,先不说是否被特朗普延续,可能最大的漏洞就是AI本身的发展,超出了政客的预测能力,甚至产业界也很难清晰预判。国内其实有一大堆"绕"的方法...还是要乐观一点。 今天真格yusen发了一个朋友圈,"越来越多的行业会迎来自己的李世石时刻"。目前o系列这条路,就是要在一个个垂直行业达到"专家水平"。从Math、code开始,到法律、科研、金融、咨询等等,当垂直行业一个个拿下,那个模糊定义的AGI,可能也就慢慢接近实现了。 本文来源:信息平权,原文标题:《国内模型追的太快了...》 风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
|
推荐内容
- 春节假期小客车上高速继续免收通行费,共计8天..
- 特朗普就职演讲释放多重经济信号,将产生哪些影响..
- 一觉醒来,大数变了
- “春节红包”来了!A股10家上市银行密集分红,3天..
- 地产股爆发!多方利好齐发力,万科A涨停,碧桂园..
- 特朗普称将对加拿大和墨西哥加征关税,亚太股市回..
- 特朗普“火上浇油”!想了解模因币?先认识下疯狂..
- 高盛发布关税预测 美国Q1对铜征收10%关税可能性约..
- 升破7.26!离岸人民币兑美元连破六大关口,特朗普..
- 特朗普签行政令废除包括人工智能监管在内的拜登政..
- 国内模型追的太快了...
- 拜登政府最后一刻收紧“小额豁免”,剑指中国电商..
- 特朗普已赚500亿美元,美国总统“发币”,你见过..
- 决定“川普2.0”走向的内斗:马斯克大战MAGA..
- 美国第一镰刀?“特朗普币”暴涨后,“第一夫人币..
热点阅读
- 恒大偿债冰山一角浮现
- 特朗普已赚500亿美元,美国总统“发币”,你见过..
- 决定“川普2.0”走向的内斗:马斯克大战MAGA..
- “中国版英伟达”?寒武纪股价突破700元,公司连..
- 拜登政府最后一刻收紧“小额豁免”,剑指中国电商..
- 美国第一镰刀?“特朗普币”暴涨后,“第一夫人币..
- AI驱动商业化加速,2025智驾拐点正在到来..
- 1月17日,比特币本轮行情见顶?
- 明天,A股有两家新股申购!
- 别只盯着美债,纳指“真正的风险”正在逼近..
- 中国12月新增社融2.86万亿元,新增人民币贷款990..
- 特朗普酝酿加密货币行政令:定为国家优先项、暂停..
- 美联储当红理事沃勒:不排除3月降息,如数据配合..
- 台积电的雷,巴菲特加仓也压不住
- “如履薄冰” 日本央行下任行长宝座是个烫手山芋..