金融圈注意了!彭博研究人员刚推出BloombergGPT
taiyang @ 2023年03月31日 财经风云
金融圈注意了!彭博研究人员刚推出BloombergGPT 葛佳明 彭博研究员构建了迄今为止最大的特定领域数据集,并训练了拥有500亿参数且专门用于金融领域的LLM——BloombergGPT。经过测试,该模型在金融任务上的表现远超现有的模型,且在通用场景上的表现与现有模型也能一较高下。 ChatGPT引爆的AI热潮也"烧到了"金融圈,彭博社重磅发布为金融界打造的大型语言模型(LLM)——BloombergGPT。 3月30日,根据彭博社发布的研究报告显示,其构建了迄今为止最大的特定领域数据集,并训练了专门用于金融领域的LLM,开发了拥有500亿参数的语言模型——BloombergGPT。 该模型依托彭博社的大量金融数据源,构建了一个3630亿个标签的数据集,支持金融行业内的各类任务,在执行金融任务上的表现远超过现有模型,在通用场景上的表现与现有模型也能一较高下。 BloombergGPT到底有多强 根据彭博发布的报告来看BloombergGPT对金融行业来说无疑是一次颠覆性创新。 我们先来看一下BloombergGPT使用到的庞大数据集。 研究人员利用彭博社现有的数据,对资源进行创建、收集和整理,构建了迄今为止最大的特定领域数据集,并创建了一个拥有超过7000亿个标签的大型训练语料库: 彭博作为金融数据公司,数据分析师在公司成立的四十年间收集了大量的金融材料,拥有丰富的金融数据档案,涵盖了一系列的主题。 我们将这些数据添加到公共数据集中,创建了一个拥有超过7000亿个标签的大型训练语料库。 BloombergGPT的训练数据库名为FINPILE,由一系列英文金融信息组成,包括新闻、文件、新闻稿、网络爬取的金融文件以及提取到的社交媒体消息。 为了提高数据质量,FINPILE数据集也使用了公共数据集,例如The Pile、C4和Wikipedia。FINPILE的训练数据集中约一半是特定领域的文本,一半是通用文本。为了提高数据质量,每个数据集都进行了去重处理。 利用庞大的数据集,并基于通用和金融业务的场景进行混合模型训练,BloombergGPT诞生了。 一般来说,在NLP领域,参数数量和复杂程度之间具有正相关性,GPT-3.5模型的参数量为2000亿,GPT-3的参数量为1750亿。 根据BloombergGPT的训练结果显示,其在执行金融任务上的表现远超过现有的模型,且在通用场景上的表现与现有模型也能一较高下。 BloombergGPT优势:不可替代性和准确性 当下,通用NPL模型也可以处理金融领域的任务,那为金融圈"量身定制"的模型究竟有何意义? 彭博认为,针对特定领域模型有其不可替代性且彭博的数据来源可靠: 因彭博社的大多数应用均为金融领域,着手构建了一个针对金融领域的模型具有优势。 除了构建金融领域的LLM外,本文的经验也为其他研究专用模型提供了参考。我们的方法是在特定领域和一般数据源上训练LLM,以开发在特定领域和通用领域上均表现优异的模型。 此外,我们的训练数据不同于传统的网络爬取数据,网络上的数据总有重复和错误,但我们的数据来源可靠。 而更重要的是,报告指出,通用NLP模型处理金融领域任务时会面临不少挑战,首先就是无法理解财经新闻背后的市场"情绪": 以情感分析为例,一个题为"某公司将裁员1万人",在一般意义上表达了负面情绪,但从金融市场情绪来看,它有时可能被认为是积极的,因为这一做法可能提振投资者信心,使公司的股价上涨。 从测试来看,BloombergGPT在五项任务中有四项(ConvFinQA,FiQA SA,FPB和Headline)表现最佳,NER(Named Entity Recognition)排名第二: 测试一:ConvFinQA数据集是一个针对金融领域的问答数据集,包括从新闻文章中提取出的问题和答案,旨在测试模型对金融领域相关问题的理解和推理能力。 测试二:FiQA SA,第二个情感分析任务,测试英语金融新闻和社交媒体标题中的情感走向。 测试三:FPB,金融短语库数据集包括来自金融新闻的句子情绪分类任务。 测试四:标题,数据集包括关于黄金商品领域的英文新闻标题,来判断新闻标题是否包含特定信息,例如价格上涨或价格下跌等。 测试五:NER,命名实体识别任务,针对从提交给SEC的金融协议中收集金融数据,进行信用风险评估。 对于ConvFinQA来说,这个差距尤为显著,因为它需要使用对话式输入来对表格进行推理并生成答案,具有一定挑战性。 BloombergGPT将助力新闻领域 既然BloombergGPT测试中的表现如此优异,那未来可以怎么用? 除了金融数据查询、回答金融相关问题,BloombergGPT未来可以被新闻领域广泛使用: BloombergGPT训练是以众多新闻为基础的,因此它未来将协助记者日常工作。 记者需要为每个部分编写简短的标题,专门为此任务设计的模型维护成本太高,但BloombergGPT在这个方面表现优异。 可以利用BloombergGPT更好的查询金融相关的知识。 如,BloombergGPT能够很好地辨别公司的CEO。(虽然BloombergGPT正确地识别了CEO,GPT-NeoX出现了错误,FLAN-T5-XXL则完全未能识别)。 对于这个或将颠覆金融圈的大型语言模型,部分网友并不买账,有人认为彭博此次只发布报告,不发布模型,颇有些"雷声大雨点小"之意。 也有网友认为,彭博赶在愚人节之前发布,可能在"骗人"。 ChatGPT为彭博点赞 部分网友不买账,那ChatGPT怎么看? 华尔街见闻就这件事专门询问了ChatGPT,ChatGPT认为BloombergGPT是一项很有意义的技术进步: 它是专门为金融领域开发的一种语言模型,可以更好地处理金融领域的数据和任务,并且在金融领域的基准测试中表现出色。 这将有助于金融从业者更好地理解和应用自然语言处理技术,促进金融科技的发展。同时,BloombergGPT还可以为其他领域的语言模型的发展提供参考和借鉴。总的来说,BloombergGPT是一个有益的技术创新。 风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
|
推荐内容
- 逆袭!600家小市值公司藏金,机构调研曝光三大爆..
- 特朗普“大重置”:债务化解、脱虚向实、美元贬值..
- 美股三大指数冲高回落,中概股重挫,纳斯达克中国..
- 深夜,重挫!近一个月最大跌幅;鸿蒙智行,连推爆..
- 活久见!美国商务部长上电视“推票”:买特斯拉股..
- 华尔街解读美联储决议:鸽派的亮点与迷你“鲍威尔..
- 深海经济利好持续加码,与商业航天、低空经济并列..
- 美联储的“关键一战”在5月,届时降不了息,那今..
- 李嘉诚押注创新药!和黄医药明星抗癌药海外大卖近..
- “三巫日”前美股反弹一日游,量子计算股暴跌,拼..
- 鲍威尔给经济焦虑“灭火”,标普创八个月来美联储..
- 腾讯要为AI砸千亿重金
- 政治危机升级,反对派领袖被捕引发土耳其股债汇三..
- 3月LPR报价出炉!1年期、5年期均维持不变..
- 五部门:依法稳步推进绿证强制消费,逐步提高绿色..
热点阅读
- 中国央行连续第三个月增持黄金,1月黄金储备环比..
- 反转?诺贝尔经济学奖花落“AI反对者”,曾表示人..
- 中央经济工作会议:“以进促稳、先立后破”的深意..
- 中国主导身体,英伟达要做大脑,特斯拉“做整合”..
- 500亿量化帝国“幕后推手”:龙头券商财富业务“..
- 大变局!特朗普或被禁止竞选总统?美国首都进入“..
- 创业板指震荡跌超1%,北交所个股全线爆发,北向资..
- 美国财长称市场调整是健康的,不保证没有衰退,“..
- 道指跌超500点!4.3万亿美元股票期权到期..
- 摩根士丹利:高价科技股的杀盘接近尾声了..
- 建设全国统一大市场意味着什么?
- 神速!这类品种再迎新成员,两大公募巨头助阵,对..
- 2008年以来最高!美国主权CDS飙升,市场预期违约..
- 央行主管媒体:物价触底回升 人民币汇率形成后续..
- 提速!又一款AI医疗大模型问世,可覆盖中国90%癌..