国内大模型迎来中场战事

由互联网和科技界掀起的大模型浪潮，迎来了新战事。

自今年3月以来，国内已有超过20家企业入局大模型赛道。从百度“文心一言”、阿里“通义千问”的发布，到360“红孩儿”、商汤“日日新”、网易“玉言”、科大讯飞“星火”、昆仑万维“天工”等的推出，再到腾讯“混元”、京东“ChatJ”、华为“盘古”等的预告。互联网巨头、科技公司纷纷秀出“肌肉”，谁也不想在这场大模型混战中掉队。

而在这场狂奔中，大模型的发展阶段已经从“通用”迈入“垂类”。

(资料图片)

算力、大规模数据、高成本人才成为大部分企业入局通用大模型的拦路虎。但深度定制、广阔的场景应用等诉求，催生了国内垂直领域大模型的开发。

近两个月来，不少医疗、金融、教育、绘画等行业内拥有用户数据积累的中小型企业，已开始基于国内外大模型“底座”，训练适配自身的垂类模型。同时，已发布通用大模型的公司，也推出了针对特有行业的模型。

如果说通用大模型是大模型发展的初期阶段，那么垂直场景应用则可以视作其“中场战事”，在该阶段，应用与场景先行，倒逼垂直领域的大模型飞跃发展，并率先在不同产业中实现了落地价值。

路线分化

短短两个月，分化已经出现。

在5月23日举办的文心大模型技术交流会上，百度智能云AI与大数据平台总经理忻舟介绍：“文心千帆大模型平台，是百度提供给客户的企业级大模型生产平台，不但提供包括文心一言在内的大模型服务及第三方大模型服务，还提供大模型开发和应用的整套工具链。”

即文心千帆可以文心一言为核心，提供大模型服务，帮助客户改造产品和生产流程；企业也可以在文心千帆上基于任何开源或闭源的大模型，开发自己的专属大模型。

多位接受全天候科技采访的业内人士认为，当前国内大模型赛道主要包括三类：一类对标GPT的通用大模型，聚焦基础层的公司；一类是在开源大模型基础之上训练垂类大模型，聚焦垂直行业的企业；另一类则是专注具体应用的纯应用公司。

“刚开始大家是一窝蜂扎进通用大模型，现在分化已经出现，不管是分化到具体行业的，还是不做研发直接调用接口做产品运营的，这个趋势是越来越清晰了。”前金山软件副总裁兼人工智能事业部负责人、现AI领域创业者李长亮告诉全天候科技。

通用大模型面临算力需求大、训练和推理成本高、数据质量不佳等挑战。一个成功的且可对外商业化输出的通用大模型大模型，要求厂商拥有全栈大模型训练与研发能力、业务场景落地经验、AI安全治理举措、以及生态开放性等核心优势。

在百度智能云副总裁朱勇看来，基础模型（通用大模型）的公司可能“只有那么几家”，但是上面会长出很多专业领域的大模型。

“训练一个基础模型，成本是非常高的，做一个千亿级的大模型，需要单机群万卡以上的算力。”朱勇说，从国内外来看，真正做通用模型的公司并没有那么多。相反，训练领域（垂类）模型所需要的代价和资源远远小于从零开始做通用模型。

因而，从商业逻辑的角度来看，大部分公司不具备做通用大模型的能力，巨头更适合做通用大模型，拥有丰富场景数据积累的公司更适合做垂域模型。

垂类大模型以深度解决行业需求为主，即企业在自己擅长的领域训练适合自己的“产业版GPT”。这类大模型生成的内容更符合特定垂类场景的需求，质量更高。

当前，已经可以看到不少垂类模型应用在金融、医疗、交易等场景中。比如，彭博社根据自身丰富的金融数据资源，基于GPT-3框架再训练，开发出了金融专属大模型BloombergGPT。

除了上述两种常见的模式，目前国内大模型创业赛道上还有一种专做应用的公司，它们没有研发团队，从现有大模型调用接口，做产品和运营。

通用VS 垂域

布局通用大模型的巨头，需要的是生态。所以百度、阿里都希望成为“大模型的底座”去赋能行业与企业。但并不是所有企业都有这样的能力。

“现有大模型的算力和能耗挑战会促使很多工作向领域专用化、轻量化的大模型方向发展，特别是金融、教育、医疗、交通等领域，大量的工作在试图降低大模型的成本。”在日前举行的第六届数字中国建设峰会上，中国科学院自动化研究所副所长曾大军表示。

相比通用大模型需要高昂的开发训练成本，基于开源模型进行垂类模型开发可兼顾开发成本和数据安全。

事实上，挑战之外，实际的场景需求也加快了大模型垂类化的过程。

“中国擅长商业模式、应用上的创新。”一位AI领域创业者说，与此同时，国内不乏AI模型的落地场景、丰富的数据，以及追风口的热情。因而，短短两个月时间，大模型领域化的发展飞速。

以百度文心千帆这个“AI大模型底座”为例，当前正在共同测试研发的企业通常来自信息化和技术普及率较高的行业，如金融行业、能源行业、泛互联网行业等。

“垂类模型是在通用大模型基础上训练的，撇开通用大模型的话，是不存在垂类模型的。”忻舟说，垂类模型强调领域的know-how，对于特定领域来说，需要针对该领域的任务做指令学习。

行业不同，场景不同，指令学习的区别也极大。比如，泛互联网行业更关注营销、推荐的效果，金融更领域更关注风控、可信、以及营销的效果。

在李长亮看来，垂类大模型与通用大模型*的区别在于：垂类大模型在资源投入、成本投入等方面的要求下降了，但额外要求是行业known-how，即对这个行业的knowledge要求提高了。

表现在数据方面，在特定的垂直领域，企业拥有私有数据，这是别的企业花钱也买不到的核心竞争力和天然优势。

表现在算力上，通过通用大模型微调实现的垂类大模型相较通用大模型是“几何级别的下降”。

根据国金证券的测算，在模型微调阶段，由于训练量级较小，仅为万级，相关的算力成本相比之下可忽略不计。

以斯坦福大学于2023年3月发布Alpaca为例，这是一个基于LLaMA-7B基座，应用5.2万指令对模型微调训练而来的对话类语言模型。该模型基于8块A100微调，微调时长3小时，算力成本不超过300元。

当然，并不是所有企业都可以在通用大模型的基础上做微调。

以百度文心千帆为例，要在该平台上通过微调做自己的大模型需具备两个条件：企业有没有高质量的数据存下来；能否将自身业务根据对生成式AI的理解变成高质量的数据，变成指定数据做指定微调。

换言之，落地在企业端，那些有海量行业数据、懂行业know-how的企业，做成垂类模型的机会更大。

“因为有专业的数据、有行业know-how，结合不同类型的领域模型，这些领域模型将来会非常繁荣，支撑上层非常繁荣的领域应用。”朱勇说。

“两条腿”走路

“GPT+行业专家系统”的模式产生了新的垂直领域大模型。

大模型*的价值在于革新商业模式，改造商业组织的每一个环节，进而起到降本增效的效果。这也是企业纷纷入局大模型的原因所在。

而Meta旗下LLaMA模型等大模型的开源为垂类模型的发展装上了加速器。

公开信息显示，LLaMA基于通用领域的开源数据集进行训练，训练数据涵盖40种语言，包含约1.4万亿Tokens。LLaMA模型一经发布就对外完全开源，吸引了广大AI开发者。

作为完全开源的*模型，LLaMA具备高度的灵活性、可配置性和泛化能力，可以作为垂类AI模型的通用基座。

尽管LLaMA模型参数量较小，但性能丝毫不逊色于PaLM、GPT-3等大语言模型。并且较小的参数规模显著降低了LLaMA模型的落地部署和二次开发难度。

“基于LLaMA这种开源模型，我们喂自己的数据，慢慢调试，就能调试出我想要的效果来。”一位AIGC领域的创业者告诉全天候科技。

全天候科技了解到，当下不少企业采用的是“两条腿走路”的策略，即：一边接入大模型API，一边在开源模型上炼模型，两者构成反馈链，加速各自能力的提升，打造创新闭环。

“调用API接口也是一个获取数据资源的有效手段。”李长亮说，这部分数据将来可能在企业训练模型的时候起作用。

在不少业内人士看来，对于各行各业来说，垂直大模型是一种全新的生产力，各个行业的垂直领域大模型对所在行业可能产生重大甚至是颠覆性的影响。

值得一提的是，在一级市场上，专注于垂类大模型的创业公司也是投资机构眼中的“宝藏”。

在不久前召开的2023中国投资年会上，天堂硅谷高级合伙人王伟将“垂直领域大模型，掌握行业数据、懂行业Know-how的项目”列为其重点投资布局的领域之一。

推荐内容

国内大模型迎来中场战事

紫金矿业是国企吗？紫金矿业为什么招这么多人？

营业账簿印花税怎么算？资金账簿和营业账簿是一个吗？

世界观焦点：创新驱动 开启新“铝”程（新气象 新作为）

多措并举推动新能源汽车下乡（政策解读）

即时：推动各地打造小吃产业集群

世界今日报丨内蒙古新增新能源并网装机531万千瓦

从电力数据积极信号看经济复苏向好态势

全球即时看！18888元求购一张票，五月天演唱会“黄牛”票价又涨回去了？

亚行首席经济学家：中国在亚太价值链中发挥重要作用

CRS和ATM的区别是什么？crs对应国标什么材料？

当前短讯！多所高校发布公务接待最新餐费标准：最高300元每人次

金融行业都包括哪些行业？金融行业还有前景吗？

股票指数有什么用？编制综合指数的基本原理是什么？

均线的简单应用是什么？均线金叉哪些最有效？

股市中的跌停就是一直在下跌吗？大盘历史上有跌停过吗？

倪夏莲续写传奇故事

睫毛膏洗不掉怎么办_睫毛膏洗不掉怎么回事 全球看点

焦点信息:新时代新征程新伟业 | 河南内乡：文旅融合激发消费新活力

【当前独家】南阳市组织16余万台（套）农机鏖战“三夏”

天天讯息：应采儿回应网友恶评 笑称网友是00后吧

每日速看!四强出炉！国乒在决赛会师？遭遇张本智和难度很大，00后组合加油

“数字员工”在3名普通青年手上诞生

EV晨报 | 售36.8万元起 全新蔚来ES6正式上市；小鹏汽车Q1财报出炉；欧拉沙龙品牌总经理文飞离职

莫让舌尖消费变浪费

全市优化营商环境工作加压推进会暨营商环境攻坚周例会召开

每日观察!张家明与中关村信息谷客商座谈

天天视讯！宋小庙老街露芳容

检修农业机械 保障“三夏”作业

但斌谈巴菲特投资理念感悟：先脚踏实地，再仰望星空 天天热点

辰东三部曲顺序表_辰东三部曲顺序怎么看

定海神珍 当前时讯

天天短讯！蒋孝章 晚年_蒋孝章为什么自杀

冬天的秘密歌词是什么意思_冬天的秘密歌词？ 环球微资讯

世界即时看！蒸龙虾需要多长时间 龙虾蒸几分钟才能食用呢

有关iOS16.6beta1的更多详细信息

TCL中环拟与Vision Industries合作投建光伏晶体晶片工厂项目 环球热头条

cowtransfer奶牛快传 cowtransfer

THE MART展示了其对现代工作场所的愿景|全球热闻

metoo什么意思中文翻译_metoo中文是啥意思

*ST搜特：法院不予受理债权人对公司提出的重整申请|当前视点

杜康：黄金波动不大，美盘继续持空看跌！-当前速递

熊猫为什么被称为国宝大熊猫_熊猫为什么被称为国宝

潇湘溪苑溺sp训诫文（潇湘溪苑长篇sp实践文）

世界热门:特锐德：子公司中标8288.52万元充电桩相关设备集中采购

全球快消息！自然人税收管理系统怎么增加企业员工（自然人税收管理系统怎么增加企业）

多家零售商上架《刺客信条：幻景》10月12日发货 天天快看

粤水电：截至2023年5月19日收盘，公司股东人数为102470户 今日快讯

川渝联合 老百姓的餐桌上多了这条“鱼”_资讯推荐

当前讯息：四川残疾人励志报告团走进清华北大等名校

速读：行走江苏湿地城市︱条子泥：湿地息壤，候鸟天堂

世界球精选！暗指Viper？前ES经理更博嘲讽：之前某些经纪公司说法 滑不滑稽？

焦点信息:把客户“宠上天”，徐工挖机这样做！

“德企中国行·走进江西”合作交流会在南昌举行

华宇软件（300271）：日K线呈现-“曙光初现”形态 后市看多（05-24）-世界微资讯

野天鹅读后感20字左右_野天鹅读后感-环球观点

哪些重疾险适合青少年？从两款不同的产品分析_全球聚焦

世界即时看！“跪地求水”当事人被举报涉嫌非法集资 警方已介入调查

曾因体育“改变命运”，广州经济第一区全力打造体育新业态|环球新视野

预计36.9万起，高合HiPhi Y 将于7月交付-世界微资讯

新动态：甄子丹“打”遍窥探者，苹果上线iPhone隐私新广告：用中国功夫，拳打隐私侵犯

晚高峰上海内环高架两车事故致一车骑上护栏，疑似两司机开斗气车|环球聚看点

天天快看点丨祸起交替通行不让行？事故全程视频曝光，上海交警认定：两车互相“斗气”，2名司机已被控制，将依法严肃处理

推出表格式调解书 洪山法院高效化解批量知识产权案件

当前资讯!首届全国城市生活垃圾分类宣传周活动正式启动

河南多家金融机构高管任职资格获核准，涉及中信银行、光大银行等

烧鸭饭的正确做法 烧鸭饭的做法介绍

当前动态:“学思想 强党性 重实践 建新功”系列评论 深入调查研究 推进主题教育 | 大象时评

“学思想 强党性 重实践 建新功”系列评论 深入调查研究 推进主题教育 | 大象时评

售价36.8万-42.6万元，蔚来全新ES6竞争优势明显提升

给孩子以心灵滋养，社会需共筑“防线”——多地开展校园心理健康“必修课”扫描

我国将于2025年底前基本实现垃圾分类全覆盖

远古“寻亲”：4.38亿年前的江夏鱼找到“亲兄弟”

聚焦：李家超：国泰航空歧视事件不容再发生

环球播报:全国首个跨省域的国土空间详细规划发布 一图详解

记者走进“雷小锋”志愿者队伍，听他们讲述安全故事_全球聚焦

多措并举防范和打击AI诈骗

美国债务违约风险逼近 看跌期权及高评级企业债成“香饽饽”

微头条丨快拍｜在黄龙的赛场上展现残疾人最美的身影！“韵味杭州”2023全国残疾人田径锦标赛在黄龙体育中心开赛

世界观焦点：创新驱动开启新“铝”程（新气象新作为）

睫毛膏洗不掉怎么办_睫毛膏洗不掉怎么回事全球看点

天天讯息：应采儿回应网友恶评笑称网友是00后吧

EV晨报 | 售36.8万元起全新蔚来ES6正式上市；小鹏汽车Q1财报出炉；欧拉沙龙品牌总经理文飞离职

检修农业机械保障“三夏”作业

但斌谈巴菲特投资理念感悟：先脚踏实地，再仰望星空天天热点

定海神珍当前时讯

天天短讯！蒋孝章晚年_蒋孝章为什么自杀

冬天的秘密歌词是什么意思_冬天的秘密歌词？环球微资讯

世界即时看！蒸龙虾需要多长时间龙虾蒸几分钟才能食用呢

TCL中环拟与Vision Industries合作投建光伏晶体晶片工厂项目环球热头条

多家零售商上架《刺客信条：幻景》10月12日发货天天快看

粤水电：截至2023年5月19日收盘，公司股东人数为102470户今日快讯

川渝联合老百姓的餐桌上多了这条“鱼”_资讯推荐

世界球精选！暗指Viper？前ES经理更博嘲讽：之前某些经纪公司说法滑不滑稽？

华宇软件（300271）：日K线呈现-“曙光初现”形态后市看多（05-24）-世界微资讯

世界即时看！“跪地求水”当事人被举报涉嫌非法集资警方已介入调查

推出表格式调解书洪山法院高效化解批量知识产权案件

烧鸭饭的正确做法烧鸭饭的做法介绍

当前动态:“学思想强党性重实践建新功”系列评论深入调查研究推进主题教育 | 大象时评

“学思想强党性重实践建新功”系列评论深入调查研究推进主题教育 | 大象时评

环球播报:全国首个跨省域的国土空间详细规划发布一图详解

美国债务违约风险逼近看跌期权及高评级企业债成“香饽饽”

【全球独家】5月LPR两项利率维持不变专家：后续整体贷款利率或以稳为主

焦点讯息：“数实相融算启未来——大数据发展看贵州”网络主题活动启动

巴特勒更新INS：被扳成3-1虽然有点失望但我们很坚定|头条

奋斗成就梦想勤劳结出硕果 ——社旗县陌陂镇后洼村马军发展特色养殖助农增收-世界通讯

全球快资讯：了解孩子生长发育情况近期有儿科义诊

环球热讯:【争做文明有礼天津人】扶残助残河西区各街道社区开展助残日主题活动

热议：基金赎回一份是多少钱基金赎回份额就是钱吗