报道:DeepSeek或加速推出新AI模型R2,最初计划在五月推出

taiyang @ 2025年02月26日 财经风云

报道:DeepSeek或加速推出新AI模型R2,最初计划在五月推出

张雅琦


DeepSeek原计划于5月初发布R2模型,但据路透社援引知情人士透露,公司正寻求尽快推出。R2预计将在编程和多语言推理方面实现更优性能。
25日,据路透社报道,DeepSeek计划提前发布其新一代AI模型R2。

报道知情人士透露,R2原定于5月初发布,但现在公司希望尽快推出。DeepSeek表示,新模型将在编程能力和多语言推理方面有所提升。

印度科技服务提供商Zensar的首席运营官Vijayasimha Alilughatta认为,"DeepSeek R2模型的发布可能成为AI行业的转折点",其成本效益高的AI模型开发方式"可能会激发全球企业加速自身努力,打破行业巨头的垄断"。

分析认为,DeepSeek的成功得益于幻方投资十多年来在研究和计算力方面的大量投入。幻方于2020年和2021年斥资12亿元人民币建立了两个AI超级计算集群,其中包括约1万片英伟达A100芯片。

DeepSeek前员工表示,公司的成功主要归功于梁文锋专注于更具成本效益的AI架构。DeepSeek采用了混合专家(MoE)和多头潜在注意力(MLA)等技术,大大降低了计算成本。

报道还称,DeepSeek采用扁平化管理模式,营造协作氛围。创始人梁文锋被前雇主描述为"低调内向",他倾向于与年轻员工一起深入技术细节。

报道援引一位前前员工表示:"梁给了我们掌控权,把我们当专家对待。他不断提问,与我们一起学习。"

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

打赏一下

微信扫一扫打赏

支付宝扫一扫打赏