深耕大模型，一个AI先行者的9年实践

上市一年有余，“AI第一股”商汤科技再次交出了一份稳健的业绩答卷。数据显示商汤科技2022年营收达38.09亿元，毛利率为66.8%。

2021年12月30日，商汤科技成功登陆港股，造就了全球AI（人工智能）领域最大资金规模的IPO。

(资料图)

彼时，产业已经渡过早期的喧嚣，开始迈进发展的深水区，质疑伴随着市场的理性情绪一起到来。这样的背景中，坚持对AI基础设施SenseCore进行研发投入的商汤科技走上了一条孤独之路。

彼时没人能想到，一年之后，NLP大模型ChatGPT在全球掀起热潮，吸引无数企业和资本争相涌入这一领域。

对于商汤科技而言，从2014年成立开始，对大模型及相关技术的积累就贯穿于企业的生命线之中。发展至今，公司已经摸索出属于自己的独特发展路径。

作为长期深耕底层技术研发、不断探索和更新商业化路径的“领先选手”，一幅值得期待的蓝图正在商汤科技面前慢慢展开。

大模型热潮中的稳健标的

早在1965年，人工智能先驱、图灵的老师司马贺曾乐观预测道：“在20年之内，机器就能够做到一个人能做到的任何事。”

遗憾的是，技术的发展与迭代难以预测。随着产业发展，研究者们将这种理想的模型概念进一步扩充为“通用人工智能（Artificial General Intelligence，AGI）”——具有一般人类智慧，可以执行人类能够执行的任何智力任务的机器智能。但尽管一代代研发者进行投入，通用人工智能的实现仍旧遥远。

直到2022年末，NLP（自然语言处理）大模型ChatGPT横空出世，这个上知天文、下知地理的生成式AI模型让人们意识到，或许人类终于敲开了通用人工智能的大门。这也是比尔·盖茨评价ChatGPT诞生“意义不亚于互联网和个人电脑的诞生”的原因。

技术跨越式演进掀起的热潮，终于让资本意识到了超大模型的研发价值。

仿佛一夕之间，对人工智能的投资再次成为主流话题，不仅一级市场中“生成式AI项目”成为追逐热点，国际科技大厂纷纷入局；二级市场中，相关概念股的股价随之水涨船高。

然而，突击式的投资、对热点和市场情绪的追逐，从来都不是人工智能产业发展的“脉搏”所在。就像商汤科技董事长、首席执行官徐立在2022世界人工智能大会上曾说过的：“人工智能和天文都是寂寞的科学，需要大量且漫长的长期积累。”

随着产业发展趋向于理性，狂热的情绪终会消弭，企业实力才是玩家们最终能否赶上这一波大模型风口的关键点。

对AI企业而言，保持技术和产品的先进程度、积极探求商业化的可能性尤为重要。

从这两个角度而言，商汤科技均已走在了行业的前头。

基于此前积累的技术能力，2023年3月14日，商汤科技开源了多模态（指能够处理文本、图像、音视频等多种数据类型）多任务通用大模型“书生（INTERN）2.5”。

书生2.5在多模态多任务处理能力方面实现多项全新突破，具备图文跨模态开放任务处理能力，可为自动驾驶、机器人等通用场景任务提供高效精准的感知和理解能力支持。

这也是在ChatGPT掀起大模型热潮之后，国内较早发布的自研大语言模型。从发布当日起，书生2.5就在通用视觉开源平台OpenGVLab上开源。

▲（书生2.5，图源/商汤科技）

在保持技术领先的同时，商汤科技还在持续优化自己的盈利能力。

根据最新发布的2022年业绩报告，商汤科技业务结构实现转型，智慧生活、智能汽车、智慧商业、智慧城市四大业务线矩阵全面升级，其中智慧生活、智能汽车整体收入均大幅上涨。

“大模型+大装置”长期战略彰显前瞻性

早在2015年，商汤科技就开始研发深度学习训练框架SenseParrots，并逐渐以此为核心、持续研发攻坚，搭建起AI基础设施SenseCore，赋能千行百业。

至今，商汤科技仍保持着稳定、高水平的研发投入。以2022年为例，商汤科技研发投入达到40.14亿元。同时在2022年，商汤科技的人均研发效率持续提升，人均每年研发模型数相较于2021年进一步提高了90%，达到9.35个。

这种对SenseCore AI大装置的长期投入，成为了商汤科技能够在大模型潮流中保持领先的“底气”。

SenseCore建立在AI原生基础设施层、深度学习平台层、算法模型层之上，打通了算力、平台、算法。基于此，商汤科技能够将不同层次的能力按需调配，进行流畅、标准化、端到端的AI模型自动生产过程，也就是提供AIaaS（人工智能即服务）。

▲（商汤科技SenseCore AI大装置，图源/商汤科技）

SenseCore AI大装置的特点，可以被归结为普惠、弹性、开放这三个词语。其所提供的AIaaS具体包括IaaS（计算基础设施服务）、PaaS（深度学习平台服务）、MaaS（模型部署及推理服务）三大部分的能力。

不论是大模型客户，还是垂直领域内的中小模型客户，不论是需要成熟模型迁移的用户，还是AI模型研发者，都可以借助SenseCore“搭配”出适合自己的解决方案。

在此前的实践中，商汤科技已经赋能了许多行业的2B客户，截至2022年末，商汤科技累计生产的商用AI模型达到了6.7万个。

在大模型领域，SenseCore AI大装置同样经受得起考验。2022年，商汤科技全面布局生成类预训练大模型，实现并完善了文本、语音、图像、视频、3D场景的多模态生成能力。

年内，商汤科技SenseCore AI大装置持续扩建，完成了2.7万块GPU的部署并实现了5.0 exaFLOPS（每秒浮点运算次数，一种计算速度单位）的算力输出能力。在这一基础上，SenseCore AI大装置最多可以支持20个千亿参数量大模型（以千卡并行）同时训练，最高可支持万亿参数超大模型的训练。

在通过各类资源的精准组合来保证大模型训练效果这一方面，商汤科技已经用实践证明了自己的实力。

以商汤科技在2023年初开源的多模态多任务通用大模型“书生（INTERN）2.5”为例，书生2.5拥有30亿参数，是目前全球开源模型中ImageNet准确度最高、规模最大，同时也是物体检测标杆数据集COCO中唯一超过65.0 mAP（全类平均正确率）的模型。

至今，SenseCore已支持了超过10个大模型训练项目，其中包括语言大模型、文生图模型、视觉大模型、多模态模型等商汤自研模型和客户自定义模型。

在服务8家客户进行大模型训练的过程中，商汤SenseCore AI大装置总共提供了7000多张GPU。