又一个媲美o1的“开源推理模型”来了!训练成本竟然不到450美元
taiyang @ 2025年01月13日 财经风云
又一个媲美o1的"开源推理模型"来了!训练成本竟然不到450美元 蒋紫涵 开发成本的大幅降低主要得益于合成训练数据的应用——NovaSky团队利用阿里巴巴的QwQ-32B-Preview模型生成了初始训练数据,随后"整理"数据混合,并利用OpenAI的GPT-4o-mini将数据重构为更易用的格式,最终形成了可用的训练集。 低成本训练人工智能推理模型的时代到来了? 近日,加州大学伯克利分校Sky Computing Lab的研究团队NovaSky发布了一个名为Sky-T1-32B-Preview的开源人工智能推理模型,这一模型在多项关键基准测试中表现出与OpenAI早期o1版本相当的水平,更令人瞩目的是,其开发成本仅为450美元! 相较于不久前动辄数百万美元的模型开发费用,Sky-T1-32B-Preview可谓是一个巨大的进步。NovaSky团队在博客文章中表示: "Sky-T1-32B-Preview的训练成本不到450美元,这证明了以低成本、高效率复制高级推理能力是可行的。" 那么,为什么NovaSky团队能大幅降低训练成本? 根据NovaSky团队的报告,开发成本的大幅降低主要得益于合成训练数据的应用——NovaSky团队利用阿里巴巴的QwQ-32B-Preview模型,生成了Sky-T1-32B-Preview的初始训练数据,随后"整理"数据混合,并利用OpenAI的GPT-4o-mini将数据重构为更易用的格式,最终形成了可用的训练集。使用8个Nvidia H100 GPU机架训练320亿参数的Sky-T1-32B-Preview模型,大约需要19个小时。 报告还提到,Sky-T1-32B-Preview在MATH500(一套竞赛级数学挑战题)和LiveCodeBench(一个编程评估集)的部分难题上,表现优于o1的早期预览版;在GPQA-Diamond(包含PhD级别的物理、生物和化学问题)测试中,Sky-T1-32B-Preview1的表现略逊于o1预览版。 不过需要注意的是,OpenAI正式发布的o1版本性能更强,且预计将在未来几周内推出更先进的o3模型。 风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
|
推荐内容
- 又一个媲美o1的“开源推理模型”来了!训练成本竟..
- 未出现新发传染病、近期流感总体低于去年同期……..
- 中美利差,汇率与货币的核心症结
- 如何看待近期商品的反弹?
- 全国商务工作会议:2025年重点做好八个方面工作..
- 法院将拍卖王自如旗下蔚来小型新能源汽车..
- 会有大逆转吗?华尔街两大投行瞄准了“1月底—2月..
- 美股“一夜回到大选前”,接下来是什么?..
- AI加剧供需紧张,铀价创历史新高
- 国债期货开盘重挫!央行释放债市重磅信号,决定阶..
- 马斯克最新采访:明年Optimus机器人产量最高达10..
- 黄仁勋主动示好特朗普,谈及三星HBM、量子计算机..
- 人民币为何走弱?如何理解央行“稳汇率”?..
- AI驱动商业化加速,2025智驾拐点正在到来..
- 市场担忧过度?华尔街:英伟达护城河坚固,Black..
热点阅读
- “中国版英伟达”?寒武纪股价突破700元,公司连..
- 比特币ETF获得“巨大成功”,Solana、比特币计价..
- 全国住房城乡建设工作会议:2025年要全面深化建筑..
- 微软发布2025年AI预测:AI Agents将彻底改变工作..
- 1月17日,比特币本轮行情见顶?
- 大摩看印股今年涨18%的三大理由:经济、盈利、散..
- 万字整理!段永平浙大师生见面会:缺钱可能是因为..
- 央行主管媒体:央行明确释放稳汇率信号..
- 2025年财政展望:转型中的“货币”财政..
- 下跌34%,保时捷在中国怎么了?
- 流感高发季到来,速福达、奥司他韦成热点!一文读..
- 美国国会正式确认特朗普当选总统
- 芯片股提振纳指,英伟达台积电新高,美元跌人民币..
- 超2000亿元!六大行“红包”将到账..
- 2024全球十大宏观事件:美日央行齐转向、中国资产..