1/0
中国式现代化奋进者|商汤生成式AI业务收入达12亿 让大模型跑起来的背后动能竟是它
东方网2024-04-01 08:42:45

东方网记者王佳妮4月1日报道:人工智能行业无疑是“新质生产力”的代表之一,生成式AI的支柱价值更是在大模型上得以体现。在炙手可热的“变现王”大模型背后,AI开发平台却显得有些默默无闻。事实上,没有以算力为核心的基础设施作为支撑,大模型根本就跑不起来。

深谙此道的商汤科技早在2018年便开始布局,以每年数十亿的“雄心”投入到SenseCore商汤大装置。2022年,作为SenseCore商汤大装置重要载体的人工智能计算中心(AIDC)正式投入运营,成为亚洲最大人工智能计算中心之一。如今,SenseCore商汤大装置管理的总算力到了何种程度?又如何赋能“日日新”大模型体系?近日,东方网记者走近位于临港的AIDC,聆听商汤这位长期深耕底层技术研发、不断探索和更新商业化路径的“领先选手”的故事。

万卡并联,输出丰厚的“新质生产力”

根据《2023年中国AI开发平台市场报告》显示,商汤在增长指数和创新指数两大评估维度的综合评分中位居国内首位。而商汤亮眼的成绩单还远不止于此。最早于国内业界研发和发布大模型产品、国内首个发布超过千亿参数级大模型和性能超越GPT3.5模型的厂商,成功研发320亿参数量的全球最大的通用视觉模型,并在自动驾驶、工业质检、医疗影像等多个领域得到广泛应用……这些成绩,都让商汤成为业内发展的“领军选手”。

2023年,商汤科技生成式AI业务收入达12亿人民币,这是商汤成立十年以来,以最快速度从无到有、超过10亿收入体量的新业务。“生成式AI业务若要长期发展,离不开算力的持续增长。换而言之,没有以算力为核心的基础设施作为支撑,大模型根本就跑不起来。”商汤科技董秘办董事总经理盛世伟在接受东方网记者采访时介绍,

目前商汤管理的算力已实现全国联网的统一调度,在上海、深圳、广州、福州、济南、重庆等地都拓展了新的计算节点,总运营算力达到12000petaFLOPS,上线GPU数量达到45000张。其中临港AIDC为8100 petaFLOPS,远远超出立项规划的3740 petaFLOPS算力总量。

“根据计划,商汤在2024年将会更大面积地拓展全国的算力节点,输出丰厚的‘新质生产力’。”盛世伟说,同时,出于更全面、长远的考虑,商汤增加了对华为昇腾、寒武纪等主流国产芯片的适配,以全国产的技术栈,支持大模型的训练、微调和推理。

而实现这一点的关键,是商汤参与联合开发的DeepLink开放计算体系。 DeepLink是连接国产硬件和主流深度学习算法框架的桥梁和纽带。DeepLink有300多个标准化算子接口;基本上CUDA能够支持的AI大模型计算需求,DeepLink也完全能够支持,覆盖率在99.5%以上。有了DeepLink,各类国产芯片就可以轻松适配主流的大模型训练框架和算法库,比如PyTorch、DeepSpeed等常见的开源训练框架,还有商汤推出的OpenMMLab、OpenDILab、OpenGVLab等开源算法库,充分发挥国产芯片的性能。

值得一提的是,目前,商汤大装置已最大实现了万卡的超大集群互联,并保持90%的加速效率。在训练稳定性上,实现超30天稳定训练不间断的能力,而出现训练间断时的诊断恢复时长也优化到了半小时。

168天刷新纪录,打造国内AIDC“样板间”

强大的算力让商汤在大模型发展上充满底气,而这基础设施方面的先发优势离不开商汤的前瞻性布局。早在2018年,商汤就已开始每年数十亿投入到SenseCore大装置,并建设了上海临港超算中心。2022年,作为SenseCore商汤大装置重要载体的人工智能计算中心(AIDC)正式投入运营,成为亚洲最大人工智能计算中心之一,堪称国内AIDC建设的“样板间”。

项目占地87亩,整体规划建筑面积13万平方米,这么一栋建筑建成需要多久?从2020年7月7日奠基,到9天后桩基开工,再到12月31日主体结构封顶仪式,整个过程只用了168天,创下新纪录,彰显上海服务、临港速度。

“商汤大装置团队规模约400人,上海这里有100多人,其余有分布在北京和深圳。在没有大装置前,商汤的所有算力或服务器都是分散在上海、北京、深圳等若干个机房内。”商汤科技大装置事业群智算中心总经理林海介绍,临港AIDC投运后,园区内纳管了超4万张卡,并实现万卡并联。

商汤科技大装置事业群智算中心技术总监宋祎寓告诉记者,临港AIDC的整体规模为13万平方米,目前一期已投运了大约7万平方米的规模。“在2022年规划园区时,算力的输出规划值是3740P,如今已超出了两倍以上,达到甚至超过8100P。但我们的发展脚步并不会停止,因为无论是应对自身需求还是外部商业化和合作伙伴的需求,算力仍有些供不应求。”

充满前瞻性的商业目光,让商汤赢得了AI2.0时代发展的先机。就在本月,商汤将公布日日新5.0大模型。展望未来,盛世伟表示,商汤会继续聚焦生成式AI业务,保持业务的持续高速增长和行业领先地位。通过进一步发挥“大装置+大模型”深度协同优势,持续扩充算力规模、提升基础设施和大模型的综合服务能力,为行业伙伴提供优质的算力和模型服务。

作者:王佳妮
知识产权、免责声明以及媒体合作联系
继续了解
知识产权声明

【知识产权声明】

除本司(指上海东方网股份有限公司)另行声明外,本司网页及客户端产品(以下简称“本网”),包括但不限于东方新闻、翱翔、东方头条等,所涉及的任何资料(包括但不限于文字、图标、图片、照片、音频、视频、图表、色彩组合、版面设计、商标、商号、域名等)的知识产权均属本司和资料提供者所有。未经本司书面许可,任何人不得复制、转载、摘编、修改、链接、镜像或以其他任何方式非法使用东方网的上述内容。对于有上述行为者,本司将保留追究其法律责任的权利。

东方网、东方新闻、翱翔,以上均为本司享有权利之合法商标,未经本司书面授权,任何单位或个人不得使用上述商标,或将上述商标用作网站、媒体名称等。

【免责声明】

1、凡本网注明来源“东方网”或“东方新闻”或带有东方网LOGO、水印的所有内容,包括但不限于文字、图片、音频视频,版权均属本司所有,任何媒体、网站或其他任何形式的法律实体和个人未经本司书面授权均不得转载、链接或以其他方式复制传播。与我司签订有关协议或已经获得本司书面授权许可的媒体、网站或其他任何形式的法律实体和个人,应在授权范围内使用,且必须注明来源“东方网”。其目的在于传递更多信息,并不意味着本司赞同其观点或认可其内容的真实性。如果其他媒体、网站或其他任何形式的法律实体和个人使用,必须保留本司注明的“稿件来源”,并自负全部法律责任。如擅自篡改为“稿件来源:东方网”,本司将依法追究责任。

2、擅自使用东方网名义转载不规范来源的信息、版权不明的资讯,或盗用东方网名义发布信息,设立媒体账号等,本司将依法追究其法律责任。

3、鉴于本网发布主体、发布稿件来源广泛,数量较多,如因作者联系方式不详或其他原因未能及时与著作权拥有者取得联系,或著作权人发现本网转载了其拥有著作权的作品时,请主动来函、来电与本司联系,或与本司授权的中国文字著作权协会联系,提供相关证明材料,我方将及时处理。
中国文字著作权协会联系方式:
联系人:赵洪波 唐亚静
地 址:北京西城区珠市口西大街120号太丰惠中大厦1027-1036室
联系电话:010-65978917
邮 箱:wenzhuxie@126.com

4、本网所有声明以及其修改权、更新权及最终解释权均属本司所有。

【媒体合作】

本司为尊重保护著作权,鼓励有益于社会主义精神文明、物质文明建设的作品的创作和传播,促进互联网良性发展,本着平等互惠、资源共享的原则,诚邀各类媒体、网站、单位、个人与本网建立友好的合作关系。
媒体合作、内容转载请联系
联系人:杨老师
联系电话:021-22899781