英伟达比例高达40%!AI芯片“推理”大战打响
zhonghua @ 2024年03月01日 财经风云
英伟达比例高达40%!AI芯片"推理"大战打响 李笑寅 AI芯片主战场正在从训练领域转向推理领域,黄仁勋:推理业务占比40%,AI终于取得成功。 AI芯片的主战场正在转向一个规模更大、竞争更激烈的领域——推理。 英伟达首席财务官Colette Kress在上周表示,英伟达最大的营收来源数据中心部门中,去年有超过40%的业务是有关部署AI模型,而非训练——这一比例是AI芯片市场开始转向的重要迹象。 训练AI模型的芯片需求一举推升英伟达成为"芯片新王",随着该行业的迅速发展,下一个市场焦点将是实际运行时用于推理的芯片。 相较于训练芯片而言,推理芯片对功耗和成本的要求没那么高,这同时也意味着竞争市场会变得更为激烈,英伟达的"新王"地位还能否延续? 从GPU到LPU 在训练阶段,公司往往会给模型"喂"海量数据进行大规模神经网络的训练。由于高计算密度、低能耗、内存带宽大等要求,目前大多数AI模型的训练均依赖于英伟达的GPU。 在推理阶段,AI模型在训练的基础上,利用神经网络模型进行推理预测,从而响应用户指令。这类芯片(LPU)对整体性能的要求没有GPU那么高,但推理引擎性能更强。 对于AI芯片制造商们来说,推理芯片正在变得越来越重要,并在市场中占据越来越多的机遇。 据报道,Melius Research的分析师Ben Reitzes在给客户的一份说明中表示: "有看法认为,英伟达未来在推理领域的市场份额将低于训练领域。" "这意味着即将到来的'推理爆炸'可能会带来一波收益。" 美银分析师Vivek Arya同样认为,伴随AI模型训练投资激增,重点将转向从AI模型中创收,推理领域相较于英伟达主导的训练领域更具竞争力。 从英伟达给出的"40%"比例来看,现在推理技术的发展速度可能要比此前预期的快得多。今年年初,瑞银分析师曾预计,到明年,有90%的芯片需求将源于训练,推理芯片仅占到市场的20%。 英伟达的竞争对手们正在蠢蠢欲动。 有观点认为,随着客户越来越讲求降低AI模型的运营成本,英特尔的芯片将越来越具吸引力。有消息称,英特尔擅长制造的芯片类型已经广泛用于推理领域,和英伟达更尖端、更昂贵的H100在实际推理应用中差别不大。 英特尔的CEO Pat Gelsinger在去年年底的一次采访中曾提到: "从经济学的角度看推理应用的话,我不会打造一个需要花费4万美元的全是H100的后台环境,因为它耗电太多,并且需要构建新的管理和安全模型,以及新的IT基础设施。" "如果我能在标准版的英特尔芯片上运行这些模型,就不会出现这些问题。" 除了英特尔和AMD等老牌芯片巨头,一些初创公司也可能"乘风而起"。 谷歌前人工智能芯片工程师Jonathan Ross创立的公司Groq是挑战者之一,该公司开发的LPU宣称是"史上最快大模型",以每秒500个token,彻底颠覆了GPT-4的40 tok/s的速度纪录。 黄仁勋:推理业务占40%,AI已成功 成本仍然是一道坎。包括亚马逊、谷歌、微软在内的巨头们一直致力于内部开发推理芯片,希望缩减运营成本。 Ross指出: "对于推理领域,你能部署多少取决于成本。" "在谷歌,有很多模型都能训练成功,但其中的80%都没能部署,因为投产的成本太高了。" 芯片软件初创公司SambaNova的CEO Rodrigo Liang表示: "我们看到我们的推理应用案例正在迅速增长。" "人们开始意识到,80%以上的成本将用于推理,我需要寻找替代解决方案。" 目前看来,英伟达仍在此次转向中处于领先地位。 据悉,英伟达一款即将推出的芯片在去年一项关键的人工智能推理基准测试中取得了行业领先的结果,延续了该公司多年来在竞争中的主导地位。 并且,英伟达最新的财报显示,该公司在AI芯片领域仍占有80%以上的市场份额。这意味着,在可预见的未来,英伟达的训练芯片预计仍将保持较高需求。 美东时间2月23日,英伟达CEO黄仁勋在接受《连线(Wired)》采访时表示,英伟达目前业务中推理占到40%,这意味着AI模型将会很快落地。他表示: "我们热爱推理。让我估算的话,我认为英伟达今天的业务构成可能是40%的推理和60%的训练。为什么这是一件好事呢?因为这意味着人工智能终于取得了成功(AI is finally making it)。" "今天,每当你在云中输入一个提示,它会生成一些东西——可能是视频,可能是图像,可能是2D,可能是3D,可能是文本,可能是图表——这背后很可能就有一块英伟达GPU。" 风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
|
推荐内容
- 隔夜对欧元和英镑暴涨,美元“强势难挡”..
- 开年货币宽松的三条线索
- 溢价率居高不下!投资者博弈美股QDII基金,多公司..
- Grok 3也“跳票”了?马斯克的“10万台GPU最强算..
- “川普2.0”第一个黑天鹅:最差情况冲击1月20日就..
- A股头条:监管部门指导1月15号之前释放全部利空?..
- 比特币ETF获得“巨大成功”,Solana、比特币计价..
- 2025年如何“掘金”A股?“首席”们这样说..
- 咖啡豆价格疯涨,“9块9”还能喝多久..
- 苹果官网突然降价,这一次最高降800元..
- 2025年银行股还能再涨吗?
- 过去几周最重要市场巨变,冲击所有资产!但汇丰认..
- 史上最吸金--贝莱德的现货比特币ETF“IBIT”..
- 充满不确定性的一月来了,这是你需要关注的重大时..
- 冰火两重天!巴基斯坦股市领跑南亚,印度股市“熄..
热点阅读
- 全国住房城乡建设工作会议:2025年要全面深化建筑..
- 中信证券:小盘股大跌并非因退市新规,而是交易“..
- 25年能否迎来“流动性牛市”?
- DeepSeek火出圈,英伟达完了吗?
- 国产AI杀出黑马、小米SU7霸屏、“悟空”爆火……..
- 假游资做号诱导投资者入“杀猪盘”,千人被骗付费..
- 十大券商展望2025中国经济:重振内需宏大叙事、消..
- 高盛展望2025:AI仍是科技行业主旋律,软件和支付..
- 卢比崩了,外资在印度股市的收益也没了……..
- 下周重磅日程:中美12月PMI公布,海内外市场元旦..
- 里根大循环的成与败
- 量子风口来袭!美量子概念股飙涨1700%,A股也被带..
- 谷歌举行2025年战略会议,CEO:风险很高,这是颠..
- 决定2024市场走向的12件大事,就在这张时间表里..
- 人民日报:为高质量发展营造良好货币金融环境——..