“考古”周靖人,主导LLM、推进MaaS、AI,下一步
“考古”周靖人,主导LLM、推动MaaS、AI,下一步如何与云整合?
撰文 / 宇婷
坚持独立的思考,不局限于此刻。
2023年4月11日,阿里云北京峰会即将召开。在百度、360相继公布了自身的大模型产品以及进展后,这一次峰会被受众高度关注,聚焦在阿里是否会正式公布其大模型的进展,以及将与阿里云如何整合?
对比微软和微软云Azure,大模型会对云业务本身会产生巨大的拉动。,微软向OpenAI投资100亿美元,获得OpenAI 75%的直接利润份额。,所有OpenAI的技术都运行在Microsoft的Azure云基础架构上,形成云资源的调用。,微软还将OpenAI的人工智能整合到Word、PoerPoint、Outlook和其他应用程序中,推动包括Teams、Loop等产品的用户量提升。
尽管中国厂商追赶ChatGPT3.5可能还要以1年为单位,但国内百度、阿里、字节、腾讯、360等大型公司,有着充足的区域市场。大厂竞争大模型,也在竞争AI生态。
文心一言目前已经有了先发优势。
对于阿里来说,根据业内消息,其特质是在AI算力的储备上充足,包括A100显卡资源目前在国内厂商中储备位列行业第一,以及寒武纪芯片等有所供应。此前阿里云也发布了自己的结构路线。
阿里巴巴在LLM(大型语言模型Large language mode)领域的研究主要由达摩院负责,目前由阿里云智能CTO、达摩院副院长周靖人主导。在2022年阿里巴巴层发布了相关自然语言大模型技术M6和plug。
阿里巴巴大模型研发成功会对天猫、淘宝、高德、钉钉等业务应用直接带来直接的商业价值。,直接通过阿里云向TO B客户提供,也会构建新的MaaS商业模式。
在两周前的阿里云北京数据库峰会上,周靖人曾有过一个简短的演讲,我查看了下周靖人过往在AI领域表达的观点,看得出周靖人对于MaaS的思考前置于这一波ChatGPT热浪,并且展现出了技术和应用的平衡。
1、成为阿里云CTO前,领导阿里大数据智能研究
在2022年12月29日阿里巴巴董事会主席兼CEO张勇发出全员邮件中,宣布了周靖人(靖人)将担任阿里云智能CTO,并继续兼任达摩院副院长。
根据搜狗百科,周靖人2004年获得美国哥伦比亚大学计算机博士学位,后加入微软担任研发合伙人。微软期间带领团队研发了支撑着微软必应搜索,Office 和 Windos 等高性能大数据计算平台。
他的主要研究方向包括大规模分布式系统和数据库、异构数据库,拥有16项相关专利,在国际多家权威期刊发表50多篇论文。
周靖人还是1994级中科大毕业生。
2016年,周靖人正式官宣加入阿里巴巴集团,负责达摩院智能计算实验室等工作。任职阿里云首席科学家,带领阿里云中美两地研发团队。总体负责阿里云大数据平台和人工智能研究iDST(Institute of Data Science Technology)的科研工作,涉及大规模机器学习和语音、自然语言、图像以及视频处理技术。
他是大规模分布式系统和数据库等领域的国际级权威学者,曾入选IEEE Fello。(百科了下IEEE Fello,即IEEE会士,是IEEE最高级别成员,也是IEEE授予成员的最高荣誉,在学术科技界被认定为权威的荣誉和重要的职业成就;当选人需要对工程科学与技术的进步或应用做出重大贡献,为社会带来重大价值。)
2017年,他做了《阿里云大数据分析与智能》主题演讲。
根据媒体新智元对当时演讲的报道,当时他演讲观点
“各大公司的计算架构都很类似,阿里云的特色在于架构间各种资源是共享的,并且,由于是自建系统(home built system),系统在调度和部署时也会便利很多。”
当时他还提到了一个比较有趣的挑战——算法是不断变化的。如果针对某个问题开发了一个特定的芯片或解决方案,解决方案和算法会随着时间的推移而改变,这样就会开发出很多特定的芯片和解决方案,然后就必须应对新的指令集,并在这么多不同的芯片上创造生态系统。
2018年双11,周靖人领导大数据智能计算团队,支撑双十一交易洪峰。2分05秒100亿元,以及实时日志处理峰值每秒17亿条。
2020年在阿里内部组织变革中晋升。2022年12月,他正式任职阿里云智能CTO,兼任达摩院副院长。
在阿里巴巴,他曾涉猎的工作包括了淘宝事业群搜索推荐、达摩院智能计算实验室、阿里大数据智能计算和搜索推荐平台。
2、推动MaaS在阿里内部落地
根据媒体AI科技评论的报道,2021 年 3 月达摩院发布国内首个千亿参数多模态大模型 M6。那时周靖人作为项目主导人,从立项开始就思考如何更好地释放像 M6 这样的大模型的基础能力。
报道提到,他思考的结果是——必须要有一个平台作为依托。在内部讨论中,这个想法一出来,就得到了达摩院各个实验室带头人的赞同。并且周靖人不断地把「模型即服务」(Model as a Service,MaaS )的理念在内部推动头脑风暴。
2022年,阿里达摩院与 CCF 开源发展委员会联合正式推出国内首个 AI 模型开源社区——魔搭 ModelScope。把300 多个模型开放给整个中国的 AI 研究者与团队,涵盖了自然语言处理、视觉、语音、多模态等模型。
魔搭社区的核心关键词是开源。当时周靖人在接受媒体采访时,提到其口号是「 AI for Everyone」周靖人解释了这句话的含义无论是 AI 兴趣爱好者,还是使用者、开发者、研究者,“模型即服务”理念均能承载不同人群对AI 的诉求,进一步落地 AI 应用。
我理解,魔搭是意图通过MaaS在具体商业场景中落地。平衡学术与应用。
“大模型的研发不应该是一场少数机构的竞赛,而应该通过大小模型的协同进化走向更高级的应用,尤其是适应中国本土需求的应用。”
作为中文大模型。 ,2022年11月 CSDN创始人蒋涛曾对话周靖人 探讨了 AI 模型社区魔搭 ModelScope,以及背后包括澜舟科技、智谱AI、深势科技、中国科学技术大学等多家科研机构的开源生态。
周靖人提到了国内关于AI大模型的应用落地挑战
“AI 模型难以覆盖各行各业的 AI 应用需求,面对新场景时,往往需要进行二次开发或优化,否则许多模型难以适配到特定环境应用中,AI 模型定制化门槛较高。以及缺乏 AI 模型开发和使用交流分享的平台。当开发者遇到相关问题后,无法找到对应的模型服务,也找不到人来解答他的问题。”
“达摩院提出模型即服务(Model as a Service)。背后逻辑是把 AI 模型当作生产的重要元素,从模型预训练到二次调优,到模型部署,围绕模型的生命周期来提供相应的服务。”
周靖人也提出了做法
一是提供模型仓库,收集模型,提供优质数据,还可针对业务场景调优。模型使用和算力需结合在一起,并提供快速体验模型,让广大开发者无需写代码就能快速体验模型的效果。
二是提供抽象接口或 API 接口,以便开发者针对模型进行二次开发。当面对具体应用场景时,提供少样本或者零样本的方式便于开发者对模型做二次优化,真正让模型应用到不同的场景中。
2022年,魔搭上比较成熟的模型包括澜舟科技的孟子系列模型,深势科技的蛋白质结构预测模型 Uni-Fold,智谱 AI 的多语言预训练模型等。
在CSDN的访谈中,还提到魔搭的商业模式突破。对比Huggingface 从明星项目 Transformer 库入手,随后构建平台让用户可以托管相关的机器学习模型和数据集,还可共享、协作与投入生产应用,目前在国外生态蓬勃发展。
周靖人认为魔搭社区填补 AI 模型应用服务的空白,建设 AI 开发者生态。魔搭更关注本土需求,提供大量中文模型,第一批提供的中文 AI 模型已超过 100 个,覆盖自然语言处理、语音等常用任务。
3、AI与云到底是什么关系。
AI 模型涉及大量的数据、算力,脱离云,在线下很难找到适合的机器来运行,AI 模型的开发和使用目前需要在云计算之上。(魔搭对接了阿里云机器学习平台 PAI 和弹性计算 ECS )
在两周前的阿里云数据库北京峰会上,阿里云智能CTO周靖人也在当天的演讲中提到一点“把数据能够有效地管理起来,特别是今天我们如何做好数据的存储、数据的分析。如何使用好数据,也发生了一系列的范式的转变。”
2023年春,AI让大众使用ChatGPT、微软办公软件,能够支付得起费用的人群直接步入AI纪元,云和AI真正到了生产力飞跃的奇点。
不久前,在访谈阿里云数据库负责人李飞飞时,也了解到。
他认为过去一二十年是信息时代数字化,也就是说企业的信息化办公实现了数字化。AI到了临界点,一定会催生这么两件事,一个叫物理世界数字化,还有一个是生物世界数字化。数据库在这里会发挥什么样的关键作用?第一,多模态的数据一定会成为事实标准,因为宏观世界数字化、微观世界数字化各种各样的数字一定会层出不穷,数据的多样性就像生物有多样性,数字化的世界里数据也是有多样性的。
仅仅回到云服务中的数据库纬度,多模态数据的存储和处理会促进处理多模态数据库爆发式增长。
云计算是以算力为基础,以数据为核心,以技术为牵引——这是计算算力的服务化,这就像是电力服务化一样。算力服务化以后,使之有意义的是数据的注入,物理世界数字化、生物世界数字化进一步映射。而以ChatGPT为代表的多模数据应用和背后的算法架构成为趋势后,算力+数据+智能,这是期待已久的数据核裂变。
本文部分观点,参考阿里云数据库负责人李飞飞的演讲。
奇闻怪事
- 黎姿老公马廷强前妻 黎姿老公马廷强前妻是谁
- 紫禁城闹鬼是真的吗 紫禁城闹鬼是怎么回事
- 80年黄河透明棺材事件 80年代黄河透明棺材始末
- 51区外星人录像是真的吗 51区外星人真的存在吗
- 姜潮麦迪娜恋爱过程 姜潮麦迪娜怎么认识的
- 根达亚文明大概离现在多久 根达亚文明距今多少
- 赤塔事件真的还是假的 赤塔事件到底怎么回事
- 百慕大三角在哪个国家 百慕大三角在哪个国家的
- 邓超出轨安以轩:邓超出轨安以轩是不是真的
- 中国十大闹鬼最凶的地方 中国十大闹鬼最凶的地
- 湘西鬼结婚事件:湘西鬼结婚事件真假
- 中国昆仑山10大灵异绝密档案 中国昆仑山10大灵异
- 李维嘉的父亲是谁 李维嘉父母是哪里人
- 朱秀华事件是不是真的 朱秀华事件的真相是什么
- 太湖冤魂:太湖冤魂事件真假
- 爪哇虎和东北虎谁厉害 爪哇虎和东北虎谁厉害一