AI iPhone前奏?苹果发表论文,解决“在手机内存上运行大模型”
laodang @ 2023年12月21日 财经风云
AI iPhone前奏?苹果发表论文,解决"在手机内存上运行大模型" 李笑寅 这项新研究支持有限容量的设备运行内存2倍大小的LLM,GPU的推理速度可以提升数十倍。媒体称,苹果将生成式AI集成到iOS 18的计划或将加快推进。 AI iPhone要来了? 据媒体报道,近日,苹果发布了一篇论文,介绍了一种可以再超出可用DRAM容量的设备上运行LLM(大语言模型)的方法。 通过大幅提高内存使用效率,这项新研究支持有限容量的设备运行内存2倍大小的LLM,GPU的推理速度可以提升数十倍。 论文称,LLM密集的计算量和内存要求对于DRAM容量来说是一大挑战,该论文构建了一个以闪存为基础的推理成本模型,将在两个关键领域进行优化:减少从闪存中传输的数据量、更多更流畅地读取数据块。 这意味着,该项突破性研究扩大了LLM适用性和可及性,苹果将生成式AI集成到iOS 18的计划或将加快推进。 LLM能在手机上运行了? 一般来说,DRAM就是我们常说的"内存",而flash(闪存)指的是硬盘。 运算数据时,CPU通常会以DRAM为"中间桥梁",把硬盘中的数据复制到内存中来,再在内存中做数据处理,这样速度可以提升至数百万倍。 但在容量上,DRAM相较于硬盘要小一个数量级。而LLM运行时,需要同时处理的数据量庞大,对容量有限的设备来说构成了极大的挑战。 但这篇论文提出的新框架似乎发现了突破点。该框架旨在将模型参数存储在闪存中,在需要的时候再将数据调入DRAM,解决了LLM运行时数据处理量超过DRAM可用容量的的难题。 具体而言,苹果主要运用了两种技术: (1)"窗口化"技术:重复使用此前激活过的神经元,以此减少数据传输; (2)"行列捆绑"技术:针对闪存的数据特征,定制访问数据块的顺序,从而增加从闪存读取的数据块大小。 论文提及,一个70亿参数的模型就需要超过14GB的内存来加载半精度浮点格式的参数,超过了大多数网络端点的承受能力。但是通过该框架,能够实现最小化数据传输并最大化闪存吞吐量,从而减少数据负载、提高内存使用效率。 研究结果显示,与传统的加载方法相比,该框架支持DRAM两倍大小的模型,在CPU和GPU中推理速度可分别提升4-5倍、20-25倍。研究团队在文末总结道: "这项突破性技术对于在资源有限的环境中部署先进的LLM尤为重要,从而扩大LLM适用性和可及性。" 手机巨头们瞄准了AI 在AI潮下,各大手机制造纷纷开始布局"人工智能+手机"。 据此前市场消息,苹果将在其iOS 18中引入AI,主要用于Siri和通讯应用程序的智能问答、生成语句等功能,此外,苹果还在探索AI在Apple Music、Page、Keynote和Xcode等应用中的潜能。 三星于11月初推出其生成式AI模型Samsung Gauss,报道称该模型将纳入即将于2024年初发布的Galaxy S24系列手机中,三星旗下笔记本电脑、平板电脑也有可能集成该模型。 谷歌的双子星大模型(Gemini)也将集成到谷歌旗下产品,11月,谷歌官宣Gemini1.0将在谷歌产品中逐步推出;Gemini Pro将集成到Bard中以进行高级推理和规划;Gemini Nano将为Pixel 8 Pro智能手机的功能提供支持。 风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
|
推荐内容
- 到底什么是“海湖庄园协议”?
- 名单涉及43个国家,分为3个限制等级,美酝酿出台..
- 美元曲线的“左侧失效”——当美元不再避险..
- 美国财长称市场调整是健康的,不保证没有衰退,“..
- 事关工资、股市、生育、医疗、住房……提振消费专..
- 罕见!“世界上最聪明的钱”被暴揍..
- 国务院国资委:坚定不移做强做优做大国有资本和国..
- 当贝森特也拥抱MAGA,华尔街明白“川普2.0”没有..
- 普京称俄同意停火30天、俄美协议或重振俄天然气供..
- 美国政府关门危机解除?民主党领袖:关门只会让特..
- 摩根大通:美股这波跌势“到位了”,接下来大概率..
- 500亿量化帝国“幕后推手”:龙头券商财富业务“..
- 特朗普再度扬言“夺岛”,称:要派更多美军到格陵..
- 小金属狂潮——全球资源国觉醒及贸易摩擦下的看涨..
- 叛军突袭逼停万吨锡矿,刚果矿场紧急撤离!沪锡今..
热点阅读
- 特朗普签了,美国建立比特币储备,但币圈“很失望..
- 英伟达电话会全纪录:黄仁勋称“需求非同寻常,D..
- 美国拟对乌克兰“断供”,欧股军工股飙升,汽车股..
- 名单涉及43个国家,分为3个限制等级,美酝酿出台..
- 国债期货开盘重挫!央行释放债市重磅信号,决定阶..
- 到底什么是“海湖庄园协议”?
- 3月“黑天鹅”已经准备好了:3月15日美国政府关门..
- DeepSeek开源周第五天:Fire-Flyer,解锁AI存储新..
- 下周重磅日程:全国两会启幕、特朗普国会演讲.....
- 市场“误杀”了?大摩:砍单CoWoS的不是英伟达,..
- “股债跷跷板”明显!周末利率债加速下挫,市场反..
- 有关俄乌和平进程、美英新贸易协定,访美的斯塔默..
- A股头条:央行发声!择机降准降息;育儿补贴真的..
- 中金:模型推演各类资产计入的加息预期..
- 日本股市再创新高,日经225指数收于34年高位..