从融云数智办公平台,看企业需要什么样的大模型?
本文中,我们将聚焦 ToB 领域,打开 AIGC 在 C 端社交泛娱乐之外的另一个切面,探索 B 端叙事的新变化。关注【融云 RongCloud】,了解协同办公平台更多干货。
过去两年,关于互联网大厂最多的消息当属裁员和关停非短期商业化项目了,但最近的舆论主基调则是“大模型战事”。
大模型,可以说是所有大厂都无法舍弃的互联网最后一个真命题,也是资本市场在新能源车之外为数不多的高回报机会。
这造成的直接结果是,厂商“不惜成本、加大投入”,从大模型参数“卷”到人才储备、研发投入及生态建设。最新一集的剧情则是,11 家大模型通过了《生成式人工智能服务管理暂行办法》备案。
根据媒体统计,他们是:
北京 5 家:百度(文心一言)、抖音(云雀)、百川智能(百川大模型)、智谱(智谱清言)、中科院(紫东太初);
上海 3 家:商汤(日日新大模型)、上海人工智能实验室(书生大模型)、Minimax(ABAB 大模型);
广东 2 家:腾讯(混元大模型)、华为(盘古大模型);
安徽 1 家:科大讯飞(星火大模型)。
备案意味着产品可以直接面向社会公众提供服务了,也意味着此前被抑制的产品扩散枷锁解除,必将促使更多厂商调整步伐和加快步调。
竞赛还没有结束,而是打开了一个高难度副本。
大模型的终极猜想
科技部《中国人工智能大模型地图研究报告》显示,截至 2023 年 5 月底,国内 10 亿级参数规模以上基础大模型至少已发布 79 个。
而根据赛迪顾问的统计,截至 7 月底,国产大模型累计发布数量达到了 130 个。假设两个统计口径相差不大,那大模型明显进入了加速通道。要知道,过去两年里,国内全年推出的大模型数量也不过 30 款左右。
那么问题来了,这么多大模型,到底能做什么用?除了吟诗作画说俏皮话,还有什么呢?
2021 年,斯坦福大学多位学者联合撰写的论文将经过大规模数据预训练的模型定义为基础模型,它们可以通过自然语言提示(prompts)适配到特定任务上,在大多数任务上取得了不错的效果。
如下图示,基础模型可以集中各种模态数据,然后适配各类下游任务。
这也就是目前我们常说的通用大模型,一般支持文字和语音输入,可以生成文字、图片等 AIGC 内容。具体到 B 端,它们可以应用在营销、办公、编程、制定计划、客服等方面,辅助用户输出邮件、大纲、代码、规划等。
根据市场研究公司 SparkToro 与数据管理公司 Datos 的调研:ChatGPT 用户使用最多的场景是编程(占所有问答的 29.14%),教育是第二大使用场景,内容创作是第三大使用场景。
但是,关于通用大模型,是不是覆盖场景越广越好?训练参数越大越好?随着行业的发展,人们的一些认知开始改变。
比如,大模型预训练数据量的比拼并不一定是好用与否的评判准则,暴力美学带来的涌现能力一定以惊人的成本为基础,但并不一定以更高的效率为结果。
所以,相比大模型,中模型、小模型或许才是更好的选择。
小冰 CEO 李笛在媒体采访中做了一个简单划分:小模型参数量在 130 亿以下;中模型需要小几百亿参数;大模型则至少 650 亿参数。
他同时表示,在通用、泛化能力达到 ROI 平衡的情况下,模型越小越好。“一个 130 亿以下的模型,可以跑在 A100 单卡上,不用做分布式,不会出现大量问题。”成本更优的情况下,中模型、小模型可以提供人类能接受的响应延迟,这更符合经济学。
场景方面也是这样——适用任何场景是有价值的,也是有代价的。通用大模型可能会缺乏行业深度,无法保证数据隐私和安全。
GPT 等通用大模型极具颠覆性,但也有着不低的使用门槛。想要生成高质量内容,掌握方法提高提示词的精准度对用户来说是必须付出的学习成本。这就给有场景沉淀的行业模型提供了机会,开发者可以在通用模型基础上进行微调,以适配更具体的场景。
营销内容创作工具 Jasper 就抓住这一需求,成为了一时风头无两的明星独角兽。其创始人是营销服务出身,掌握大量专业数据,并且已经建立了稳固的用户社群。Jasper 因此得以在用户反馈中快速迭代,通过各类实用模板降低了使用门槛,做出了产品差异化。
现在比较成熟的解决方案是,在通用大模型底座之上开发行业大模型。
互联网大厂每年研发投入资金高达百亿元,在大模型赛道上是当之无愧的“第一梯队”玩家。此外,商汤科技、科大讯飞、同花顺、孩子王等 AI 及行业公司也发力这个赛道。而他们的优势,就是在细分领域的积累。
根据钛媒体的梳理,在商务写作方面,科大讯飞的星⽕大模型成绩更优异。
当然,评测或多或少有点应试教育的味道,打分和刷榜也不是大模型比拼的核心,只能提供有限的决策参考。
何况,在实际使用中,各行业的需求并不相同。一些对 AI 能力要求不高的企业,可以直接调用行业甚至通用大模型的能力;而要求特别复杂的企业,需要专属大模型。
比如,麦肯锡的“Lilli”让员工可以更轻松地访问他们多年积累下来的庞大知识库。其底层来自麦肯锡合作伙伴 Cohere 公司开发的大语言模型,利用麦肯锡的 10 万份内部文档和访谈记录训练而成。
拥有专属知识库和语料库的企业都可以打造属于自己的专属大模型,而相应地,每个人都拥有一个定制化个人大模型也是顺其自然的未来畅想。
这样,大模型的构成至少包括通用大模型、行业大模型及面向 B 端的企业大模型和面向 C 端的个人大模型。
不过,无论是哪种大模型,当务之急都是找到契合的场景和商业化客户。
大模型的 B 端业务渗透路径
我们在文章 AIGC,你看我还有机会吗?中对 AIGC 各层级的商业机会和发展逻辑进行了分享,引用了投资机构 a16z 对 AI 产业的划分:底层是算力基础设施,中间层是基础大模型,上层则是 AI 应用。
国内互联网大厂向来喜欢既做“裁判”又当“运动员”,企图击穿底层算力、中层模型和上层应用,做“全栈”选手。
但是,如何将大模型的能力与行业场景有效结合永远是一道难题。
抵达实践场景的路径,绝不是一条直线。
行业大模型的基础是场景化、企业专属大模型的基础是定制化,这与企业的数字化转型一样,要在通用能力基础上具备行业积累和企业实践。
对千行百业都具备深刻的认知很难,拥有研发和微调能力的大模型厂商需要在提供通用模型的基础上,与掌握下游垂直、细分场景的行业生态协同共创,一起建立行业和企业大模型。
这样看,大模型进入 B 端业务,与融云作为安全、可信的数智化技术服务商的路径一样。
早在 2018 年,融云便以通讯中台能力与伙伴协作赋能政企协同工作场景,主要交付方式是作为通讯模块被集成于办公等各种系统中。
这种广泛集成能力需要背靠强大的产品服务能力。根据艾瑞咨询《2023 年全球互联网通信云行业研究报告》,融云 IM 连续多年稳居行业占有率第一。
融云通信服务被市场公认的优势之一便是“SDK / API 接口丰富且灵活”,拥有完善的 IM 产品矩阵和强大的消息分发机制,方便二次开发集成。
与此同时,基于具体的业务场景,融云作为 PaaS 服务商,可提供组件化、模块化服务,具备灵活的上层诠释能力,与合作伙伴一起深入客户业务,一同寻求解决方案。
就是在这个过程中,融云以办公产品中的通讯能力为触角,探索和沉淀了政企办公在不同场景的业务能力。
在此基础上,融云基于亿级通讯技术打造了数智办公平台,为政府及企事业单位、公安军工、金融保险、交通、能源等行业客户提供高并发、高可用,组件灵活,安全可信的数智办公解决方案。
深入场景、理解业务,才能更好地服务 B 端客户。大模型最终落地场景,还是需要走入更垂直、更开放的业务交互中。
从这个层面上来看,中国走过多年的数字化产业升级道路,可以为大模型赛道提供一定的借鉴意义。
AIGC 常看常新,我们也在学习中整理了一些颇有助益的行业报告、论文。感兴趣的朋友,敬请移步融云全球互联网通信云微信公众号,在对话框里发送“AIGC”即可获得这些资料。