百“模”大战伊始，商业化已经提上日程

百“模”大战伊始，商业化已经提上日程

日期：2023-07-11 17:40:21

阿里巴巴的绘画大模型“通义万相”、华为的盘古大模型3.0、中国电信的“TeleChat大模型”……7月刚刚过去10天，发布或是即将发布的大模型新品已经超过10款，目前国内市场上大模型已经进入百“模”大战。

尽管不少公司的大模型都是刚刚上线，但是大家都已经关注大模型的商业化问题。百度、阿里、华为等在发布通用大模型的基础上，已经在推动大模型在多个行业的私有化部署、企业定制等，帮助企业将大模型嫁接到公司生产、销售等服务中。

百“模”大战开启

在上周举办的上海世界人工智能大会（WAIC）上，30余款大模型齐聚，而这只是国内大模型的冰山一角。

仅通用大模型在今年发布有百度智能云的“文心”系列、阿里云的“通义”系列、华为云的“盘古大模型”、商汤的“日日新”、出门问问的“序列猴子”、第四范式的“式说”等，发布大模型的公司已经从最初的互联网科技公司，延伸到创业公司、通信公司。

而即将入场的企业也络绎不绝，京东宣布将在7月13日发布千亿级“言犀大模型”，中国移动将于近期发布“九天”1+N大模型，医渡科技称正在研发医疗大模型，奇安信集团则表示正在研发安全行业大模型，科大讯飞将在10月发布通用大模型，全面对标ChatGPT。

今年5月底举行的中关村论坛上发布的《中国人工智能大模型地图研究报告》显示，中国10亿级参数规模以上大模型已发布了79个，主要集中在北京和广东。随着近两月大模型批量发布，国内说是百“模”大战也并不夸张。

大模型的密集发布，一方面是公司需要借发布大模型秀研发能力的“肌肉”，中金公司一位高管曾表示，过去3个月他参加的一半以上的会都是和人工智能相关的，另一方面则是大模型的“门槛”在逐渐降低。

“2020年，训练一个GPT3大模型，需要450万美金；2022年，这个量级变为45万美金；上周的最新变化是，在美国使用3584张H100（NVIDIA的AI高端显卡）训练GPT3，一共需要11分钟，整体开销2万美金。”九章云极的联合创始人尚明栋在一次分享中提到，算力将不再是从业者进行大模型计算的鸿沟，随着国家针对算力进行顶层架构设计，模型算力缺口也有可能逐步得到解决。

写诗画图成大模型标配

随着大模型的密集发布，大模型的邀请码已经从此前的“一码难求”，到现在可以较容易获得。

“前段时间，山海大模型、WPS智能办公都给了我大模型的试用码，让我试用。”做广告设计的张先生说，出于个人爱好，从ChatGPT开始，他一直在找各种各样的大模型试用体验，加了很多大模型试用的群聊。

刚开始试用码挺难得到的，像百度的文心一言、阿里的通义千问都是托了好几个朋友才获得的体验码，后来发行的大模型越来越多，这种试用码也就没有那么稀缺了，甚至会有公司主动找过来让他试用。

从大模型的功能来看，文生文、文生图等能力是“标配”，尽管各家企业强调的侧重点有所不同，比如有的强调连续对话能力、有的更擅长提纲的生成，有的强调作画可以捕捉人物的细节部位，有的能够帮用户补全提示词，生成摄影级图像……但张先生感觉，实际上各家的能力差别并不是特别大。

“最初比较期待AI写诗、作图等功能可以部分替代日常工作，但现在来看质量并没有特别出众的。”张先生说，他测试的七八款大模型还不能胜任。

在与AI对话过程中，他比较关注的上下文理解、内容真实性、符合伦理安全等方面，但现在来看并没有突破性进展，大模型“一本正经胡说八道”的情况还是时有发生。

服务企业才是商业化关键

不过，用户测试的写诗、作图只是大模型追求“热闹”的消费级应用，大模型厂家关注的其实是面向企业的行业应用，这关乎大模型商业化。

刚刚发布的华为盘古大模型就表示，其将致力于政务、金融、制造、铁路、煤矿、制药、气象等行业。百度知识增强文心（ERNIE）系列模型，也表示将为电力、燃气、金融、航天、传媒、城市等行业提供行业大模型。

汽车也是大模型商业化的重要领域，奔驰宣布与ChatGPT合作，百度的文心一言被接入长安、吉利、岚图、红旗、零跑等众多车企之中，理想汽车更是宣布自研大模型MindGPT，不少大模型都成为自动驾驶的重要加持力量。

而一些垂直小行业，也涌现出有商业化可能大模型。

金山办公大模型的AI办公产品“WPS AI”，主攻润色文章，自动制作表格和PPT，用户可以让AI把一篇提纲制作成PPT，并能随意更换PPT风格。语言智能科技企业蜜度刚刚发布了大模型“蜜度文修”，其专门针对校对这个垂直行业，在垂直领域的效果以及成本优于通用大模型。

对大厂来说，除了大模型本身商业化外，他们也可以通过为其他大模型研发企业提供算力、数据管理等基础设施服务而获得商业化的机会。以华为为例，7月6日，其旗下算力解决方案昇腾AI集群全面升级，成为业界首个万卡AI集群。此前，腾讯云也面向大模型发布新一代高性能计算集群，算力性能较前代提升高达3倍。

资本市场大模型概念降温

国内“百模大战”如火如荼，资本市场ChatGPT概念股却出现降温。从6月20日开始，A股ChatGPT概念指数就开始持续下跌，截至7月10日收盘，该指数已经下跌近20%，科大讯飞、三六零、金山办公等股价都出现了不同程度的回落。

一级市场对大模型的投资也有所放缓，美国大模型企业种子轮投资交易数量下降了44%。截至今年6月底，“百模大战”之下国内也仅有十几家大模型初创公司获得融资。已公布的融资中，融资规模最大的是MiniMax，今年6月获得腾讯公司超过2.5亿美元A轮融资；光年之外在被美团收购前，也获得了2.3亿美元的天使+轮融资。

资本市场的降温，与ChatGPT的访问量不谋而合。根据分析公司 Sameweb的数据，今年6月，ChatGPT的流量出现了去年11月推出以来的首次下降。

“访问量下滑，一方面因为新鲜劲儿过去，人们发现ChatGPT准确率并不靠谱，另一方面就是大模型隐私问题，OpenAI至今还没有给出明确的解决方案。”民生证券计算机行业分析师吕伟说，大模型在资本市场降温，因为现在的人工智能发展类似1998年的互联网，处于起步阶段，机会很大，但也有泡沫。

但他认为，正如互联网本身不是泡沫，人工智能也不是泡沫，未来大厂、创业公司都将在人工智能的不同领域有所建树。

“基础平台建设方面，肯定还会是大企业主导，但在一些垂直行业领域，创业公司的机会也很多。”吕伟说，创业公司可以通过调用基础模型进行训练，这将使得创业公司进入大模型市场的门槛变得更低。