阿里巴巴的绘画大模型“通义万相”、华为的盘古大模型3.0、中国电信的“TeleChat大模型”……7月刚刚过去10天,发布或是即将发布的大模型新品已经超过10款,目前国内市场上大模型已经进入百“模”大战。
尽管不少公司的大模型都是刚刚上线,但是大家都已经关注大模型的商业化问题。百度、阿里、华为等在发布通用大模型的基础上,已经在推动大模型在多个行业的私有化部署、企业定制等,帮助企业将大模型嫁接到公司生产、销售等服务中。
百“模”大战开启
在上周举办的上海世界人工智能大会(WAIC)上,30余款大模型齐聚,而这只是国内大模型的冰山一角。
仅通用大模型在今年发布有百度智能云的“文心”系列、阿里云的“通义”系列、华为云的“盘古大模型”、商汤的“日日新”、出门问问的“序列猴子”、第四范式的“式说”等,发布大模型的公司已经从最初的互联网科技公司,延伸到创业公司、通信公司。
而即将入场的企业也络绎不绝,京东宣布将在7月13日发布千亿级“言犀大模型”,中国移动将于近期发布“九天”1+N大模型,医渡科技称正在研发医疗大模型,奇安信集团则表示正在研发安全行业大模型,科大讯飞将在10月发布通用大模型,全面对标ChatGPT。
今年5月底举行的中关村论坛上发布的《中国人工智能大模型地图研究报告》显示,中国10亿级参数规模以上大模型已发布了79个,主要集中在北京和广东。随着近两月大模型批量发布,国内说是百“模”大战也并不夸张。
大模型的密集发布,一方面是公司需要借发布大模型秀研发能力的“肌肉”,中金公司一位高管曾表示,过去3个月他参加的一半以上的会都是和人工智能相关的,另一方面则是大模型的“门槛”在逐渐降低。
“2020年,训练一个GPT3大模型,需要450万美金;2022年,这个量级变为45万美金;上周的最新变化是,在美国使用3584张H100(NVIDIA的AI高端显卡)训练GPT3,一共需要11分钟,整体开销2万美金。”九章云极的联合创始人尚明栋在一次分享中提到,算力将不再是从业者进行大模型计算的鸿沟,随着国家针对算力进行顶层架构设计,模型算力缺口也有可能逐步得到解决。
写诗画图成大模型标配
随着大模型的密集发布,大模型的邀请码已经从此前的“一码难求”,到现在可以较容易获得。
“前段时间,山海大模型、WPS智能办公都给了我大模型的试用码,让我试用。”做广告设计的张先生说,出于个人爱好,从ChatGPT开始,他一直在找各种各样的大模型试用体验,加了很多大模型试用的群聊。
刚开始试用码挺难得到的,像百度的文心一言、阿里的通义千问都是托了好几个朋友才获得的体验码,后来发行的大模型越来越多,这种试用码也就没有那么稀缺了,甚至会有公司主动找过来让他试用。
从大模型的功能来看,文生文、文生图等能力是“标配”,尽管各家企业强调的侧重点有所不同,比如有的强调连续对话能力、有的更擅长提纲的生成,有的强调作画可以捕捉人物的细节部位,有的能够帮用户补全提示词,生成摄影级图像……但张先生感觉,实际上各家的能力差别并不是特别大。
“最初比较期待AI写诗、作图等功能可以部分替代日常工作,但现在来看质量并没有特别出众的。”张先生说,他测试的七八款大模型还不能胜任。
在与AI对话过程中,他比较关注的上下文理解、内容真实性、符合伦理安全等方面,但现在来看并没有突破性进展,大模型“一本正经胡说八道”的情况还是时有发生。
服务企业才是商业化关键
不过,用户测试的写诗、作图只是大模型追求“热闹”的消费级应用,大模型厂家关注的其实是面向企业的行业应用,这关乎大模型商业化。
刚刚发布的华为盘古大模型就表示,其将致力于政务、金融、制造、铁路、煤矿、制药、气象等行业。百度知识增强文心(ERNIE)系列模型,也表示将为电力、燃气、金融、航天、传媒、城市等行业提供行业大模型。
汽车也是大模型商业化的重要领域,奔驰宣布与ChatGPT合作,百度的文心一言被接入长安、吉利、岚图、红旗、零跑等众多车企之中,理想汽车更是宣布自研大模型MindGPT,不少大模型都成为自动驾驶的重要加持力量。
而一些垂直小行业,也涌现出有商业化可能大模型。
金山办公大模型的AI办公产品“WPS AI”,主攻润色文章,自动制作表格和PPT,用户可以让AI把一篇提纲制作成PPT,并能随意更换PPT风格。语言智能科技企业蜜度刚刚发布了大模型“蜜度文修”,其专门针对校对这个垂直行业,在垂直领域的效果以及成本优于通用大模型。
对大厂来说,除了大模型本身商业化外,他们也可以通过为其他大模型研发企业提供算力、数据管理等基础设施服务而获得商业化的机会。以华为为例,7月6日,其旗下算力解决方案昇腾AI集群全面升级,成为业界首个万卡AI集群。此前,腾讯云也面向大模型发布新一代高性能计算集群,算力性能较前代提升高达3倍。
资本市场大模型概念降温
国内“百模大战”如火如荼,资本市场ChatGPT概念股却出现降温。从6月20日开始,A股ChatGPT概念指数就开始持续下跌,截至7月10日收盘,该指数已经下跌近20%,科大讯飞、三六零、金山办公等股价都出现了不同程度的回落。
一级市场对大模型的投资也有所放缓,美国大模型企业种子轮投资交易数量下降了44%。截至今年6月底,“百模大战”之下国内也仅有十几家大模型初创公司获得融资。已公布的融资中,融资规模最大的是MiniMax,今年6月获得腾讯公司超过2.5亿美元A轮融资;光年之外在被美团收购前,也获得了2.3亿美元的天使+轮融资。
资本市场的降温,与ChatGPT的访问量不谋而合。根据分析公司 Sameweb的数据,今年6月,ChatGPT的流量出现了去年11月推出以来的首次下降。
“访问量下滑,一方面因为新鲜劲儿过去,人们发现ChatGPT准确率并不靠谱,另一方面就是大模型隐私问题,OpenAI至今还没有给出明确的解决方案。”民生证券计算机行业分析师吕伟说,大模型在资本市场降温,因为现在的人工智能发展类似1998年的互联网,处于起步阶段,机会很大,但也有泡沫。
但他认为,正如互联网本身不是泡沫,人工智能也不是泡沫,未来大厂、创业公司都将在人工智能的不同领域有所建树。
“基础平台建设方面,肯定还会是大企业主导,但在一些垂直行业领域,创业公司的机会也很多。”吕伟说,创业公司可以通过调用基础模型进行训练,这将使得创业公司进入大模型市场的门槛变得更低。