深耕大模型,一个AI先行者的9年实践
上市一年有余,“AI第一股”商汤科技再次交出了一份稳健的业绩答卷。数据显示商汤科技2022年营收达38.09亿元,毛利率为66.8%。
2021年12月30日,商汤科技成功登陆港股,造就了全球AI(人工智能)领域最大资金规模的IPO。
(资料图)
彼时,产业已经渡过早期的喧嚣,开始迈进发展的深水区,质疑伴随着市场的理性情绪一起到来。这样的背景中,坚持对AI基础设施SenseCore进行研发投入的商汤科技走上了一条孤独之路。
彼时没人能想到,一年之后,NLP大模型ChatGPT在全球掀起热潮,吸引无数企业和资本争相涌入这一领域。
对于商汤科技而言,从2014年成立开始,对大模型及相关技术的积累就贯穿于企业的生命线之中。发展至今,公司已经摸索出属于自己的独特发展路径。
作为长期深耕底层技术研发、不断探索和更新商业化路径的“领先选手”,一幅值得期待的蓝图正在商汤科技面前慢慢展开。
大模型热潮中的稳健标的
早在1965年,人工智能先驱、图灵的老师司马贺曾乐观预测道:“在20年之内,机器就能够做到一个人能做到的任何事。”
遗憾的是,技术的发展与迭代难以预测。随着产业发展,研究者们将这种理想的模型概念进一步扩充为“通用人工智能(Artificial General Intelligence,AGI)”——具有一般人类智慧,可以执行人类能够执行的任何智力任务的机器智能。但尽管一代代研发者进行投入,通用人工智能的实现仍旧遥远。
直到2022年末,NLP(自然语言处理)大模型ChatGPT横空出世,这个上知天文、下知地理的生成式AI模型让人们意识到,或许人类终于敲开了通用人工智能的大门。这也是比尔·盖茨评价ChatGPT诞生“意义不亚于互联网和个人电脑的诞生”的原因。
技术跨越式演进掀起的热潮,终于让资本意识到了超大模型的研发价值。
仿佛一夕之间,对人工智能的投资再次成为主流话题,不仅一级市场中“生成式AI项目”成为追逐热点,国际科技大厂纷纷入局;二级市场中,相关概念股的股价随之水涨船高。
然而,突击式的投资、对热点和市场情绪的追逐,从来都不是人工智能产业发展的“脉搏”所在。就像商汤科技董事长、首席执行官徐立在2022世界人工智能大会上曾说过的:“人工智能和天文都是寂寞的科学,需要大量且漫长的长期积累。”
随着产业发展趋向于理性,狂热的情绪终会消弭,企业实力才是玩家们最终能否赶上这一波大模型风口的关键点。
对AI企业而言,保持技术和产品的先进程度、积极探求商业化的可能性尤为重要。
从这两个角度而言,商汤科技均已走在了行业的前头。
基于此前积累的技术能力,2023年3月14日,商汤科技开源了多模态(指能够处理文本、图像、音视频等多种数据类型)多任务通用大模型“书生(INTERN)2.5”。
书生2.5在多模态多任务处理能力方面实现多项全新突破,具备图文跨模态开放任务处理能力,可为自动驾驶、机器人等通用场景任务提供高效精准的感知和理解能力支持。
这也是在ChatGPT掀起大模型热潮之后,国内较早发布的自研大语言模型。从发布当日起,书生2.5就在通用视觉开源平台OpenGVLab上开源。
▲(书生2.5,图源/商汤科技)
在保持技术领先的同时,商汤科技还在持续优化自己的盈利能力。
根据最新发布的2022年业绩报告,商汤科技业务结构实现转型,智慧生活、智能汽车、智慧商业、智慧城市四大业务线矩阵全面升级,其中智慧生活、智能汽车整体收入均大幅上涨。
“大模型+大装置”长期战略彰显前瞻性
早在2015年,商汤科技就开始研发深度学习训练框架SenseParrots,并逐渐以此为核心、持续研发攻坚,搭建起AI基础设施SenseCore,赋能千行百业。
至今,商汤科技仍保持着稳定、高水平的研发投入。以2022年为例,商汤科技研发投入达到40.14亿元。同时在2022年,商汤科技的人均研发效率持续提升,人均每年研发模型数相较于2021年进一步提高了90%,达到9.35个。
这种对SenseCore AI大装置的长期投入,成为了商汤科技能够在大模型潮流中保持领先的“底气”。
SenseCore建立在AI原生基础设施层、深度学习平台层、算法模型层之上,打通了算力、平台、算法。基于此,商汤科技能够将不同层次的能力按需调配,进行流畅、标准化、端到端的AI模型自动生产过程,也就是提供AIaaS(人工智能即服务)。
▲(商汤科技SenseCore AI大装置,图源/商汤科技)
SenseCore AI大装置的特点,可以被归结为普惠、弹性、开放这三个词语。其所提供的AIaaS具体包括IaaS(计算基础设施服务)、PaaS(深度学习平台服务)、MaaS(模型部署及推理服务)三大部分的能力。
不论是大模型客户,还是垂直领域内的中小模型客户,不论是需要成熟模型迁移的用户,还是AI模型研发者,都可以借助SenseCore“搭配”出适合自己的解决方案。
在此前的实践中,商汤科技已经赋能了许多行业的2B客户,截至2022年末,商汤科技累计生产的商用AI模型达到了6.7万个。
在大模型领域,SenseCore AI大装置同样经受得起考验。2022年,商汤科技全面布局生成类预训练大模型,实现并完善了文本、语音、图像、视频、3D场景的多模态生成能力。
年内,商汤科技SenseCore AI大装置持续扩建,完成了2.7万块GPU的部署并实现了5.0 exaFLOPS(每秒浮点运算次数,一种计算速度单位)的算力输出能力。在这一基础上,SenseCore AI大装置最多可以支持20个千亿参数量大模型(以千卡并行)同时训练,最高可支持万亿参数超大模型的训练。
在通过各类资源的精准组合来保证大模型训练效果这一方面,商汤科技已经用实践证明了自己的实力。
以商汤科技在2023年初开源的多模态多任务通用大模型“书生(INTERN)2.5”为例,书生2.5拥有30亿参数,是目前全球开源模型中ImageNet准确度最高、规模最大,同时也是物体检测标杆数据集COCO中唯一超过65.0 mAP(全类平均正确率)的模型。
至今,SenseCore已支持了超过10个大模型训练项目,其中包括语言大模型、文生图模型、视觉大模型、多模态模型等商汤自研模型和客户自定义模型。
在服务8家客户进行大模型训练的过程中,商汤SenseCore AI大装置总共提供了7000多张GPU。
追寻技术最高目标的“长跑”
如果说近期各类大模型的兴起,敲开了通用人工智能的大门,那么,什么时候才能实现真正的通用人工智能?
对这个问题,还没有人能给出答案。就像OpenAI(ChatGPT大语言模型的研发机构)创始人Sam Altman说的那样:“我对此只有一个新的认识,那就是它不会是一蹴而就,而将是一个渐进的过程。也就是“缓慢起飞”。人们对什么时候能实现AGI,不会达成共识。”
不过,可以确定的是,我们正处在不断逼近技术终极目标的长征路上。每一项人工智能的技术创新,都有望成为哺育新兴业态、促进既有商业模式焕新、解放生产力的一片肥沃土壤。
据Gartner预测,至2023年将有20%的内容被生成式AI所创建;至2025年生成式AI产生的数据将占所有数据的10%(目前不到1%)。另据红杉预测生成式AI将产生数万亿美元经济价值,到2025年,国内生成式AI应用规模有望突破2000亿。
而在这条通往通用人工智能的路上,唯一的“钥匙”就是坚持研发和投入,秉持不断试错和调整步伐的耐心与决心。
从2014年成立开始,商汤科技已然踏足这条对技术终极目标的追逐之路,成为整个产业中的标杆玩家。未来,商汤科技仍将继续这场“长跑”。
商汤科技表示,未来公司将继续把实现通用人工智能作为核心发展战略,并从5大方面进行深入挖掘和探索。
具体来说,公司将以SenseCore AI大装置作为大模型生产的核心平台,持续扩展大装置的能力,包括投资高性能计算基础设施例如高速网络、大规模数据存储以及强大的计算节点。
商汤科技还计划将多模态大模型的研发作为战略投入方向,不断提升大模型的数据理解和生成能力、多任务泛化能力。
另外,商汤将与全球领先的芯片制造商、全球研究机构、高校和企业展开合作,共同探索算力优化的新途径,推动AI算力的发展。
为了确保AI技术的发展惠及全人类,致力于降低AI技术的成本和门槛,商汤科技将通过开源项目、共享资源和合作研究等方式,与全球AI研究者和开发者共同推进AI技术的发展。
在商业化角度,商汤科技将推进大装置和大模型能力对智慧生活、智能汽车、智慧商业、智慧城市四大板块赋能。通过充分利用大模型的能力,不断升级、强化四大业务线产品矩阵,提高产品竞争力,以商业化为抓手提升人工智能在各行各业的应用。
市场热情如潮水般时涨时落,而对硬科技企业而言,追逐热点势必难以攀上技术的高峰。想要达到技术的下一阶段,坚持长期主义才是唯一的方法论。
就像商汤科技董事长、首席执行官徐立在接受采访时曾提到的:“商汤科技优势在于长线的人工智能发展思维及商业落地的能力。我始终认为,技术运用到行业中是有工业使用的红线。如果技术没有达到红线,就很难发挥商业价值。”
在真正到达通用人工智能的“彼岸”之前,AI产业中还需要更多如商汤科技一般的玩家,对长期主义施以实践。
参考文献:
《人工智能推动世界前行》,新华访谈
作者 | 董温淑
编辑 | 董雨晴
关键词: