“千模酣战” 金融业大模型为何还在“前牛顿时代”?

2023-07-11 09:52:04 来源: 21世纪经济报道

刚刚过去的世界人工智能大会(WAIC)上,各家厂商AI大模型“大秀肌肉”。在“千模大战”的硝烟背后,大众普遍关心的话题是,谁将历经千帆成为中国版OpenAI?


(相关资料图)

“大模型的迭代是一场‘暴力’填数据、拔规模而造就的‘美学盛宴’。”中金公司研究团队在近日发布的“AI浪潮之巅”系列报告中如是说。

尽管作为推动AI大模型发展的“三驾马车”,数据、算力、算法都关系着大模型技术商业化落地的成败,但从多位接受21世纪经济报道记者采访的业内人士看来,在“抢芯片”之外,决定大模型质量和商业化落地的核心要素是数据。对于既要安全又要发展的金融业而言,在数据共享尚不充分的大模型起步阶段,更需要建立开放的行业生态。

大模型时代的数据之痛

金融行业对模型并不陌生,机器学习也不是新鲜词。

一直以来,在智能营销、智能风控、智能投研、智能客服等领域,基于机器学习驱动的建模能力都是金融机构数智化转型的基础。“大模型”是大型语言模型的简称,机器用大规模语料库数据进行训练,通过算法从数据中学习如何完成任务,参数规模大、数学公式复杂。从AlphaGo到ChatGPT,如今机器已经可以在开放系统下实现自我学习与持续反馈。

与过去相比,当下的大模型时代对算力、算法、数据的需求已然改变。

“今天的AI体系是强依赖数据的,是数据驱动的智能体系。”蚂蚁集团副总裁兼首席技术安全官韦韬表示。

“这次OpenAI为我们带来的最重要的技术并不是几千亿的参数,而是基于数据的反馈,让这个系统在持续强化学习下越来越聪明。”马上消费金融CIO蒋宁告诉记者,即使大模型具备优秀的算法,如果没有高质量数据集的训练,就像失去学习能力的博士生,会逐步失去竞争力。

然而,目前“千模竞帆”背后是国内各厂商的数据生态割裂。

“目前在通用大模型建设过程中,一方面当前中文高质量数据有限,另一方面中国移动互联网生态与互联网生态处于割裂情况。”蒋宁告诉记者。

上海数据交易所副总经理韦志林在接受21世纪经济报道记者采访时指出,大模型之所以强大,能够不断地迭代,都依赖于算力算法以及最重要的数据。“在‘三驾马车’中,数据是最核心、最长远、最基础的要素,它每天都在产生,应用场景非常丰富。”从其与大模型企业沟通的情况来看,相较全球语料库建设,国内语料库供给需要进一步提升,语料库的质量、标准、多样性都有所欠缺。

“大模型技术出现后,数据供应的过程中还遇到四方面问题。”中国电子副总经理陆志鹏提到,一是缺少合规确权的机制,目前国内面临的问题就是数据的有效供给不足。很多企业都在做语料库,但数据都非常有限,而且可能面临着统一标准的问题;二是缺少数据的计量估价机制;三是缺少协调分配;四是缺少安全隐私保护机制。

“我们国家的数据生产量全球排名在第二名,但是分散在各个行业、各个组织中,整体的数据是分开的。但大模型所需要是将数据进行物理归集,在短时间内基于一定的算力与算法进行预训练。”韦志林提到,国内各大主流厂商都推出了基于己方已有数据的大模型,但由于数据分散、丰富度不足、质量参差不齐等原因,各个大模型都存在一定的局限性。

“数据已经成为重要的生产要素,当数据开放共享的安全与收益分配机制还不完善,具有大量数据的头部大厂开放高质量数据集的意愿不足,所以其主要将数据价值创新服务于企业内部,而没有拿出去的动力。”韦志林表示。

金融业的垂直大模型解法

通用大模型激战正酣,金融业的大模型运用则主要在行业垂直模型领域。

今年3月,彭博针对金融业推出大型语言模型BloombergGPT,引发市场对金融垂直领域大模型的关注。

在国内,今年5月,星环科技推出了第一款面向金融量化领域的生成式大语言模型“无涯Infinity”,度小满开源国内首个千亿参数金融大模型“轩辕”,今年6月,恒生电子发布金融行业大模型LightGPT,并宣布将于9月底正式开放试用接口。

多位受访对象向21世纪经济报道记者表示,目前金融业的大模型运用主要在工具层与应用层,无论是技术服务商还是金融机构,都在“量力而为”。

“我们以后不会再开发其他领域的模型,每个行业都有自己的行业壁垒。”星环科技CEO孙元浩在接受记者采访时提到,公司的主要战略是提供大模型(LLMOps)的工具链,帮助金融机构训练自己的大模型。“基础大模型与应用之间的鸿沟实在是太大了,我们不可能用一家公司去做每个行业的大模型。和过去相比,大模型主要有两个方面需要改造,一是高达上千亿的模型参数,需要算力支持,需要分布式、高可扩展的调度框架,二是巨量的高质量语料训练。”孙元浩表示,在过去服务于证券行业时,有二十万个已完成标注的语料,也开发了量化因子,使得其训练的模型基于量化策略可以直接用来做示范交易。

对金融机构内部来说,垂直领域的大模型更类似于“个性化小助手”与业务流程优化助手。

众安保险首席技术官蒋纪匀告诉记者,大模型在保险业的落地,需要关注大模型在保险专业领域的知识增强,在合规安全的前提下,对接口调校和限制也有更高要求。因此众安自主研发了AIGC中台灵犀,通过适配如GPT、通义千问、文心一言等国内外主流大模型,灵犀可以帮助保险机构更好适配AIGC能力,允许机构用户,在大模型内嵌入行业专业领域知识库,实现AIGC在保险垂直领域的应用快速适配。

“谈论大模型技术在金融核心业务场景下的应用为时尚早。”萨摩耶云创始人兼董事长林建明在接受21世纪经济报道记者专访时提到,金融业对于算法可解释性与可信度要求极高,AI仍处于“前牛顿时代”,人类还没有搞懂基本原理,目前萨摩耶云对语言生成模型的应用主要集中在结合个性化推荐、用户画像等,解决线上线下协同过程中的自动化断点问题。

行业拥抱生态互通

当通用大模型走向金融行业落地,割裂的数据生态使越来越多的机构拥抱合作互通。

就在7月10日,中国证监会科技监管局局长姚前刊文《关于大模型生态建设的若干思考》。姚前指出,在具体应用落地的过程中,GPT类大模型还会面临一系列挑战。一是如何确保训练数据的数量与质量。一般而言,大模型的训练语料为来自于多个领域的通用语料,而专业语料的收集通常比较耗时费力,同时也存在隐私问题,由此导致大模型在具体的个别应用领域可能出现专业性不足的情况。二是如何降低大模型的运行和维护成本。大模型需要巨大的算力支持和严格的数据治理,普通的机构和应用部门往往难以支撑大模型的运行以及迭代升级工作。为此,需要建立一个各类模型健康交互和协同进化的生态,以保证大模型相关人工智能产业可以在各个应用领域成功落地。

目前金融机构与通用大模型厂商的合作正在加速。在世界人工智能大会上,交通银行与华为、腾讯云、科大讯飞宣布共建3个联合创新实验室,分别聚焦大模型在金融领域的应用与创新、增强网络空间安全防御能力、研究认知模型在金融领域的应用。

针对目前金融数据开放依然不充分的问题,科大讯飞总裁吴晓如在接受21世纪经济报道记者采访时表示,其在合作中的做法分为两步,第一步是无监督训练,把大量公开数据和素材放进模型,帮助金融机构训练基础模型;如果金融机构需要模型针对行业做精细化调整,其并不需要太大算力,科大讯飞将在联合创新实验室中为金融机构提供工具,让其自己做调试优化。

标签:

“千模酣战” 金融业大模型为何还在“前牛顿时代”?

刚刚过去的世界人工智能大会(WAIC)上,各家厂商AI大模型“大秀肌肉”

07-11 09:52:04

贝斯特:上半年归母净利同比预增50%-70%

App7月11日消息,贝斯特公告,预计2023年上半年归母净利1 20亿元-1 36

07-11 09:18:43

沪铝减仓上涨 氧化铝震荡回落【7月10日机构评论】

7月10日讯:今日沪铝减仓上涨,沪铝2308合约涨140元至17990元 吨,沪铝

07-11 09:01:50

养老在北京|92岁大爷走丢,多亏了这个“小钥匙”

00:27北京日报客户端|记者王雅贤牛伟坤去年,香河园街道的1500位独居、

07-11 08:23:34

华兰疫苗(301207):7月10日北向资金减持5.07万股

7月10日北向资金减持5 07万股华兰疫苗。近5个交易日中,获北向资金减持

07-11 07:24:02

诸葛孔明千载人翻译阅读答案(幻想三国孔明任务答案)

诸葛孔明千载人翻译阅读答案,幻想三国孔明任务答案这个很多人还不知道

07-11 06:23:57

奖牌榜倒数!淘汰了中国男足的他们亚运一金未得,空有3千万人口

亚运会过半,对于中国代表团来说,目前最大的遗憾当属中国男足淘汰赛首

07-11 04:58:18

日本上半年企业倒闭数量同比大幅增加

新华财经东京7月10日电(记者刘春燕钟雅)日本民间企业信誉调查机构东

07-11 01:16:35

央行等两部门延长两项金融政策 对房企提供持续稳定支持

新华社北京7月10日电题:央行等两部门延长两项金融政策对房企提供持续

07-10 22:33:32

被争议“私建浮桥”背后的白城市:人口外流、收入下降

来源|大猫研究所&大猫真探社一个已经拆掉的浮桥,改变了18个人的命运

07-10 21:58:23

常见的1元硬币,有这个年份单枚价值上千元,你有吗?

在物质世界中,硬币可能被视为最常见而普通的物品之一。我们在日常生活

07-10 21:01:36

朝阳区实验小学2023年美术教师培训

2023年7月1日至4日,北京市朝阳实验小学教育集团迎来了“北京剪纸”非

07-10 20:17:14

被“圈”起来的公厕丨社区已为商户配备门禁 街道协调后续问题

公共卫生间的设置一般都是在路边、公园里等人员方便进出的地方,但是最

07-10 19:27:08

铁甲情痴终结者2(铁甲情痴终结者)

甲情痴终结者2,铁甲情痴终结者这个问题很多朋友还不知道,来为大家解

07-10 19:12:54

正源股份:控股股东收到法院预重整决定书,决定对其进行预重整并指定临时管理人

正源股份7月10日公告,正源地产于2022年9月26日向大连中院提交重整(含

07-10 18:45:32

AI创作能够彻底取代作家群体吗?

AI创作能够彻底取代作家群体吗? 随着人工智能技术的快速发展,AI写

07-10 18:19:16

河北博野:“小墙绘”为和美乡村赋能添彩

盛夏时节,漫步在河北省博野县梨树种植专业村博野镇冯村的大街小巷,沿

07-10 17:38:46

《2023中国金融科技企业首席洞察报告》正式发布

该报告基于全国范围内250家金融科技企业的首席执行官、创始人或金融科

07-10 17:15:04

上半年南京卖地收入355亿 同比大涨76%

上半年南京卖地收入355亿同比大涨76%-最新统计数据显示,2023年上半年

07-10 17:03:03

北京拟规定:途经长安街部分路段及天安门广场公交车禁设车身广告

公交车如何设置车身广告将有统一规范。《北京市公共汽电车车身户外广告

07-10 16:29:17

荣耀 MagicPad 平板电脑现身 Geekbench 平台,搭载高通骁龙 888

IT之家7月10日消息,荣耀官方宣布将于7月12日举行全场景新品发布会,届

07-10 16:12:53

永登绘就“安居乐业图”

永登绘就“安居乐业图”- "小小玫瑰花装扮了田野,也成为当地村民致富

07-10 15:32:36

朝鲜谴责美国计划向半岛地区派遣战略核潜艇

新华社首尔7月10日电据朝中社10日报道,朝鲜国防省发言人10日发表声明

07-10 15:13:19

襄阳谷城:提升“烟火气” 点燃“夜经济”

谷城:提升“烟火气”点燃“夜经济”

07-10 14:46:18

卡普空最新大作支持不同平台联机 玩不了Steam

卡普空最新大作《原始袭变》官方近日发布消息,游戏将在首日发售时推出

07-10 14:04:03

李豫为何不与独孤贵妃合葬?有哪些不同原因?

李豫是唐朝的一位皇帝,他的皇后独孤贵妃也是历史上著名的女性之一。然

07-10 13:25:03

解读:中南财经政法大学在职研究生好不好考?

作为国内知名的财经和法学高等教育机构,中南财经政法大学在职研究生项

07-10 12:23:12

保险为什么不建议趸交?

保险公司不建议客户趸交保费,因为这可能对其资金流量和投资收益产生不

07-10 12:03:26

谁⁉️ 王涛:今年夏天,将有一位超超超级巨星来访

本文谁⁉️王涛:今年夏天,将有一位超超超级巨星来访到此分享完毕,希

07-10 11:31:16

共谋人与自然和谐共生现代化·俯仰山水尽苍翠

盛夏的贵州,气候凉爽,满目苍翠,全省高达62 81%的森林覆盖率,绿色堪

07-10 11:01:05

中科三环:7月7日融券卖出金额150.80万元,占当日流出金额的0.82%

同花顺数据中心显示,中科三环7月7日获融资买入2997 52万元,占当日买

07-10 10:31:17

外媒:丰田首次正式确认拟在泰国生产电动汽车

7月9日消息,丰田在一份声明中表示,正考虑在泰国生产电动汽车。报道称

07-10 10:24:11

国家统计局:6月份居民消费价格同比持平 环比下降0.2%

7月10日,国家统计局网站发布,6月份,全国居民消费价格同比持平。其中

07-10 09:58:11

雷暴大风黄色预警!明天入伏!

刚刚,苏州气象发布雷暴大风黄色预警信号预计未来6小时我市姑苏区、虎

07-10 09:33:55

“鲜味”如何从枝头直达手头

数据来源:国家邮政局等制图:汪哲平“叮咚——”下午3点09分,上海浦

07-10 08:59:28

高温天气新能源汽车如何顶住“烤”验?一个系统搞定所有

近日的高温天气,对各行各业以及人们的生活产生了不小的影响。我们首先

07-10 08:18:17

人报甘头条 | 中国足协女子五人制足球联赛总决赛将在兰举办

本文转自:人民日报客户端赵帅杰记者获悉,7月19日至27日,2023中国足

07-10 07:14:36

汪小菲没有接回孩子,张兰一番玩笑话若发生,会改变大S赢家局面

7月6日汪小菲一个人落寞出现在机场,接受了媒体的采访,他还笑着对记者

07-10 06:05:06

栖霞市朝熙街美食节期间咋停车 快来看!

2023年7月13日,栖霞市朝熙街美食节将正式启动,7月7日,各商家开始在

07-10 02:11:43

在家门口过足“戏瘾”!海口美兰区“大致坡周末剧场”开幕[图]

海口网7月9日消息(记者陈捷通讯员王聘钊)7月8日晚,“琼华艺苑绽美兰

07-09 22:37:25

发电、晒盐、养殖三不误!世界单体容量最大“盐光互补”电站并网发电

7月8日,世界单体最大的“盐光互补”项目——华电天津海晶100万千瓦“

07-09 21:42:42

高速上,一黑熊突然扑上来!车废人伤

近日,黑龙江绥化。赵先生携妻子驾车外出旅行,途中一只野生黑熊突然窜

07-09 20:30:47

NBA3消息:5队16人大交易,雷霆0换7极限操作,雄鹿签约利文斯顿

北京时间7月9日,NBA自由市场开启9天,不少全明星球员已经找到下家,而

07-09 19:09:17

俄乌冲突500天后,黑海谷物倡议即将到期,续签命运如何?

俄乌此前为确保全球粮食顺畅供给的《黑海谷物倡议》这一次会顺利续签吗

07-09 17:58:36

Go 并发模型—Goroutines

前言Goroutines是[Go](https: go dev)语言主要的并发原语。它看起来

07-09 16:35:00

朝阳站迎宾大道完成改造升级 道路两侧浓荫夹道

朝阳站迎宾大道完成改造升级道路两侧浓荫夹道-大道两侧浓荫夹道,配合

07-09 15:27:32

《黎明杀机手游》国际服无法登陆服务器怎么办

黎明杀机手游更新后,常常会有《黎明杀机手游》国际服服务器无法登陆怎

07-09 14:14:52

驾照年审过期一个月怎么办

一、驾照年审过期一个月怎么办驾照年审过期一个月的,可以补审。驾驶证

07-09 13:04:40

北大教授张千帆结局(北大教授猛烈大胆演讲)

1、所以说是“前无古人,后无来者”,从此北大再也不敢邀请李敖了!百

07-09 11:59:27

包浆是什么意思网络用语(包浆是什么意思)

来为大家解答以下的问题,浆是什么意思网络用语,包浆是什么意思这个很

07-09 10:57:13

贝斯特:上半年归母净利同比预增50%-70%
沪铝减仓上涨 氧化铝震荡回落【7月10日机构评论】
养老在北京|92岁大爷走丢,多亏了这个“小钥匙”
华兰疫苗(301207):7月10日北向资金减持5.07万股
诸葛孔明千载人翻译阅读答案(幻想三国孔明任务答案)
奖牌榜倒数!淘汰了中国男足的他们亚运一金未得,空有3千万人口
日本上半年企业倒闭数量同比大幅增加
央行等两部门延长两项金融政策 对房企提供持续稳定支持
被争议“私建浮桥”背后的白城市:人口外流、收入下降
常见的1元硬币,有这个年份单枚价值上千元,你有吗?
朝阳区实验小学2023年美术教师培训
被“圈”起来的公厕丨社区已为商户配备门禁 街道协调后续问题
铁甲情痴终结者2(铁甲情痴终结者)
正源股份:控股股东收到法院预重整决定书,决定对其进行预重整并指定临时管理人
AI创作能够彻底取代作家群体吗?
河北博野:“小墙绘”为和美乡村赋能添彩
《2023中国金融科技企业首席洞察报告》正式发布
上半年南京卖地收入355亿 同比大涨76%
北京拟规定:途经长安街部分路段及天安门广场公交车禁设车身广告
荣耀 MagicPad 平板电脑现身 Geekbench 平台,搭载高通骁龙 888
永登绘就“安居乐业图”
朝鲜谴责美国计划向半岛地区派遣战略核潜艇
襄阳谷城:提升“烟火气” 点燃“夜经济”
卡普空最新大作支持不同平台联机 玩不了Steam
李豫为何不与独孤贵妃合葬?有哪些不同原因?
解读:中南财经政法大学在职研究生好不好考?
保险为什么不建议趸交?
谁⁉️ 王涛:今年夏天,将有一位超超超级巨星来访
共谋人与自然和谐共生现代化·俯仰山水尽苍翠
中科三环:7月7日融券卖出金额150.80万元,占当日流出金额的0.82%
外媒:丰田首次正式确认拟在泰国生产电动汽车
国家统计局:6月份居民消费价格同比持平 环比下降0.2%
雷暴大风黄色预警!明天入伏!
“鲜味”如何从枝头直达手头
高温天气新能源汽车如何顶住“烤”验?一个系统搞定所有
人报甘头条 | 中国足协女子五人制足球联赛总决赛将在兰举办
汪小菲没有接回孩子,张兰一番玩笑话若发生,会改变大S赢家局面
栖霞市朝熙街美食节期间咋停车 快来看!
在家门口过足“戏瘾”!海口美兰区“大致坡周末剧场”开幕[图]
发电、晒盐、养殖三不误!世界单体容量最大“盐光互补”电站并网发电
高速上,一黑熊突然扑上来!车废人伤
NBA3消息:5队16人大交易,雷霆0换7极限操作,雄鹿签约利文斯顿
俄乌冲突500天后,黑海谷物倡议即将到期,续签命运如何?
Go 并发模型—Goroutines
朝阳站迎宾大道完成改造升级 道路两侧浓荫夹道
《黎明杀机手游》国际服无法登陆服务器怎么办
驾照年审过期一个月怎么办
北大教授张千帆结局(北大教授猛烈大胆演讲)
包浆是什么意思网络用语(包浆是什么意思)
云南吃菌分风险区 7县区被定为“高风险”
X 广告
资讯
X 广告

Copyright ©  2015-2023 京津冀畜牧网版权所有  备案号:京ICP备2022022245号-12   联系邮箱:434 922 62 @qq.com