1/0
世界人工智能大会| 复旦大学计算机科学技术学院教授邱锡鹏:发挥上海自身优势,建设国际算法创新基地
文汇报2023-07-07 16:54:10
100706_p15.jpg

如果用一个词来概括2023世界人工智能大会(WAIC2023)的热点,那么大模型当之无愧。百度文心、阿里通义、华为盘古、讯飞星火、商汤日日新、复旦MOSS……国内外30余款大模型将同台竞技,背后的核心开发团队也将悉数亮相。这是一条“狂飙”的新赛道。去年底,对话式大型语言模型Chat GPT火爆出圈,激起AI领域“千层浪”,也带动大模型这一重要的底层基座变得炙手可热。今年以来,国内“百模大战”趋于白热化,那么下一步是重技术还是重应用?自主研发大模型,对于上海科创中心建设有着怎样的意义?2023世界人工智能大会开幕之际,记者采访了复旦大学计算机科学技术学院教授邱锡鹏。

出生5个月,MOSS更强了

作为学界顶尖研究者,邱锡鹏还有一个更让人关注的身份——复旦大学MOSS系统负责人。今年2月,邱锡鹏团队发布MOSS,成为国内首个发布的类ChatGPT模型。复旦大学MOSS系统亮相WAIC2023,将是该大模型首次现身大型展会。邱锡鹏告诉记者,过去5个月来,MOSS系统日夜成长,不断迭代优化,比如:4月20日,第三轮迭代版本MOSS003大模型上线,成为国内首个插件增强的开源对话语言模型。“相比2月‘出生’时,如今的MOSS系统性能提升不少,主要表现在逻辑能力、无害性、有用性等方向。”邱锡鹏总结道,大模型靠大量语料来训练,一些能力已超越大部分成年人。“围绕大模型,我们做的不仅仅是模型本身,还有很多挑战要解决。”邱锡鹏举例说,其中一个就是普惠化,即将大模型巨大算力成本降下来,“过去优化一个百亿参数量级的大模型,需要数个A100芯片做硬件支撑,一台机器就要100多万元,并非普通研究机构承担得起。”5个月来,这也是邱锡鹏的主要研究方向之一。就在上个月,他带领团队发布了低内存优化技术(LOMO),可将大模型训练内存使用量降低到之前的10.8%,新方法能够在一台消费级显卡的机器上,对650亿参数大模型进行全参数微调,大大降低了使用门槛。

技术与应用,两手都要抓

随着ChatGPT火遍全球,国内“大模型之战”也已打响。中国科学技术信息研究所发布的《中国人工智能大模型地图研究报告》显示,截至5月底,国内10亿级参数规模以上的大模型已发布79个,互联网大厂、人工智能公司、行业头部企业、高校及科研机构、大数据及云计算供应商都参与到大模型的比拼中。如果算上垂直应用方向,说“千模大战”并不过分。那么,走出实验室阶段的大模型,未来发展应该更重技术还是更偏应用?在邱锡鹏看来,技术与应用两手都要抓。作为一线科研工作者,他对于当下国内的大模型技术并不满意,“虽然是‘百模大战’‘千模大战’,但国内竞逐者的大模型基座比较雷同,从技术到模型架构,再到能力,没有让人特别眼前一亮的产品。竞争者未来一定要结合自主研发,做出更多有创新性的产品。”邱锡鹏也提到了应用驱动的重要性,正如中国在移动互联网应用领域领跑全球,应用是我们的优势项。“任何技术走出实验室,在下游落地应用的过程中,都会遇到很多挑战,以应用驱动技术发展是一种很好的方式。”但他指出,目前国内缺少的是支撑高级应用的功能,比如一些高级的插件以及推理能力,特别是在有用性方面,缺少能真正帮助人们提升效率的杀手级应用。他透露,目前复旦大学MOSS系统在开源社区里的下载量排名靠前,“截至目前,我们已收到几百家企业的使用申请,覆盖智能信息服务、金融、医疗、教育等行业,不少企业在使用后也给出反馈,绝大部分希望在垂直领域有进一步优化。”

做好技术基座助力科创中心建设

作为生成式人工智能的技术底座,大模型无疑是兵家必争之地。从《报告》数据来看,国内大模型的“出产地”集中在北京、上海、广东和浙江等省市,这4个地方也是近3年人工智能服务器采购数量最高的地区。在邱锡鹏看来,争夺大模型的技术底座话语权,对于上海科创中心建设的意义重大。相比于国外技术实力,目前国内大模型还有一定差距,体现在语料清洗、工程、算法等方面,对自主研发的要求很高。再往生态圈延伸,国内大模型需要从头到底有一套自主研发的技术,适配国内的配套硬件,保障在任何环节不被卡脖子。邱锡鹏认为,上海在前沿科技领域有独特的优势,体现在人工智能企业数量多、能级高,从底层技术到大模型、算力,从系统设计到应用,全链条企业都有涉及,更容易从生态上做规划。就在近日,《上海市推动制造业高质量发展三年行动计划(2023-2025年)》出炉,其中对大模型、算力等多方面作出指引,提出“瞄准人工智能技术前沿,构建通用大模型,面向垂直领域发展产业生态,建设国际算法创新基地”。邱锡鹏认为,上海应发挥自身优势,在AI大模型领域走出有中国特色的创新路。

*文汇独家稿件,转载请注明出处。
作者:徐晶卉
知识产权、免责声明以及媒体合作联系
继续了解
知识产权声明

【知识产权声明】

除本司(指上海东方网股份有限公司)另行声明外,本司网页及客户端产品(以下简称“本网”),包括但不限于东方新闻、翱翔、东方头条等,所涉及的任何资料(包括但不限于文字、图标、图片、照片、音频、视频、图表、色彩组合、版面设计、商标、商号、域名等)的知识产权均属本司和资料提供者所有。未经本司书面许可,任何人不得复制、转载、摘编、修改、链接、镜像或以其他任何方式非法使用东方网的上述内容。对于有上述行为者,本司将保留追究其法律责任的权利。

东方网、东方新闻、翱翔,以上均为本司享有权利之合法商标,未经本司书面授权,任何单位或个人不得使用上述商标,或将上述商标用作网站、媒体名称等。

【免责声明】

1、凡本网注明来源“东方网”或“东方新闻”或带有东方网LOGO、水印的所有内容,包括但不限于文字、图片、音频视频,版权均属本司所有,任何媒体、网站或其他任何形式的法律实体和个人未经本司书面授权均不得转载、链接或以其他方式复制传播。与我司签订有关协议或已经获得本司书面授权许可的媒体、网站或其他任何形式的法律实体和个人,应在授权范围内使用,且必须注明来源“东方网”。其目的在于传递更多信息,并不意味着本司赞同其观点或认可其内容的真实性。如果其他媒体、网站或其他任何形式的法律实体和个人使用,必须保留本司注明的“稿件来源”,并自负全部法律责任。如擅自篡改为“稿件来源:东方网”,本司将依法追究责任。

2、擅自使用东方网名义转载不规范来源的信息、版权不明的资讯,或盗用东方网名义发布信息,设立媒体账号等,本司将依法追究其法律责任。

3、鉴于本网发布主体、发布稿件来源广泛,数量较多,如因作者联系方式不详或其他原因未能及时与著作权拥有者取得联系,或著作权人发现本网转载了其拥有著作权的作品时,请主动来函、来电与本司联系,或与本司授权的中国文字著作权协会联系,提供相关证明材料,我方将及时处理。
中国文字著作权协会联系方式:
联系人:赵洪波 唐亚静
地 址:北京西城区珠市口西大街120号太丰惠中大厦1027-1036室
联系电话:010-65978917
邮 箱:wenzhuxie@126.com

4、本网所有声明以及其修改权、更新权及最终解释权均属本司所有。

【媒体合作】

本司为尊重保护著作权,鼓励有益于社会主义精神文明、物质文明建设的作品的创作和传播,促进互联网良性发展,本着平等互惠、资源共享的原则,诚邀各类媒体、网站、单位、个人与本网建立友好的合作关系。
媒体合作、内容转载请联系
联系人:杨老师
联系电话:021-22899781