阿里云计算有限公司副总裁
曹思培
大家好,今天是相聚福建的场合,阿里和华为其实是目前在中国可以提供全栈AI能力的两家公司。
首先从2023年开始,有一个ChatGPT的突然一下子爆发,使得我们经历了第一次震惊,听说了一个叫OpenAl的公司,很多人开始研究OpenAI这个公司的前世今生,大家有很多的记忆浮现出来,中国第一个中文大语言模型,也就是我们今天口口相传的大模型,其实是简称大语言模型。然后我们看到百度的文心一言,随之而来包括阿里的通义、讯飞的星火,突然一段时间Kimi出来,在一个个的APP入口中大家讨论Kimi很好用,我们发现很多在校的高校大学生中研究生中他们都在用夸克。
实际上,在过去的25个月里,我经历了极大的压力。当时,我感到自己可能被边缘化了。我们团队成员大多来自通信或计算机专业,但在当前人工智能的浪潮中,无论是在国际上获得诺贝尔奖的成就,还是在中国由清华大学等众多高等学府引领的科研成果,取得显著成绩的并非全是计算机专业背景。许多成功者来自自动化、电子工程等领域。这说明了什么呢?我们不妨共同探讨。刚才,我聆听了来自浪潮和华为的同行们关于大模型在各行各业应用落地的挑战性话题,这让我回想起大约四五年前,阿里巴巴云推出了一个名为“大脑”的产品。那时,我们是一家以2C平台为主的公司,在进军行业市场时遭遇了巨大的挑战。
初次遭遇客户对我们缺乏信任时,他们质疑一家互联网及电子商务公司如何能够理解钢铁、水泥以及制造业。为了克服这一障碍,我们不得不带领海外归国的博士生亲自进行实地考察,这一过程我们已经历过。今日,我们所面临的挑战确实颇为艰难。当时,我们采用深度学习的技术和工具来处理特定场景下的问题,旨在解决可度量的结果和成效。我们努力使客户愿意为此付费。然而,我们所面临的困难还包括缺乏有效地连接和生态系统,缺乏行业领导企业的信任,以及缺乏政府的支持和政策。这些挑战,我们都曾——经历。
当然我们在座的所有中国人非常自豪,发现美国的现任总统替我们做了一个广告,引发了英伟达股价的崩溃,当然回头又回来了,这里面会有很多的概念,因为我们每天都在学习,这种学习使得我们对大模型对人类改革到底是工具的革命还是革命的工具这件事会有不同的认知。
今天我会看见现在大语言模型、基础的大模型包括开源和闭源的事情其实在DeepSeek里面给出了一个间接看起来结论性的引领。至少它解放了绝大部分这个社会的参与者,无论是政府的管理者,各个政府的业务部门的管理者,数据部门的管理者还是企业以及我们这些科技的从业者,我们都往这一个标准去对标,所以解放了大家的心智。
我们实际上看起来上面有大量的Agent应用的兴起,包括在深圳,我上次听了很多的事情做数据公园、数据员工,会有很多的场景出现,这就是工具的革命。
同时我们也会看到,我们真正开始进入后训练和推理的市场,所以我们会看到其实H20在我们国家滞销了,推理的市场一下子变化了,原来还没有那么多。模型的迭代真正带来了应用市场新的创新和繁荣,整个大模型发展其实是整个数字化体系的发展,全球的竞争就是中国和美国的竞争,只有这两个国家在这五个基础能力之上有可能上擂台。其他国家相差巨大。
这里第一个是基础模型研发能力,第二个是整个算力资源的发展,第三个是整个应用生态的搭建,第四个是人才的培养,第五个就是应用场景很多的积累。中国和美国尤其是我们国家在独立自主可控越来越强调的前提下,在各自的赛道上,美国在部分的领域领先我们,但是我们在开源模型的市场已经逐步取得领先。
在这五大能力里面,阿里云的五个能力还是都不错的,其中三个核心能力就是今天阿里云真正在Al时代最大的核心能力,第一个是阿里云本来是云计算公司,我们是中国最早做云计算的,目前我们的市占率最高,但是我们与友商的关系是一起做大蛋糕。因为我们是做云出身的,我们相比而言跟其他的友商比起来我们可能不是一个硬件研发科技公司传统的企业,所以我们从天然开始就要做到一云多兼容的兼容可开放性,尤其是华为、浪潮、曙光这些都是我们在供应链里面大量合作和供应。
同时阿里在开源大模型的投入现在有越来越多人知道,在29号的凌晨阿里发布千问3,在开源模型上又再一次霸榜,其实我们不是跟DeepSeek竞争,DeepSeek马上会有R2新的版本发布。大家会很新奇看到相当长一段时间中国的这两家杭州开源大模型的公司会在国外的榜单上挤压掉谷歌、Meta这些模型,这个是我们可以值得骄傲一段时间。
第三个,今天我们在整个福建展区展台里面第一次给大家展现了阿里云的硬件能力,我们基于这个公司的硬件能力,全端的国产化,包括GPU芯片,今天阿里云一体机是基于DeepSeek官方的满血版是性价比第二高的,性价比第一高是H20的141G显存的机器,对显存的依赖使得它天然的设计使得一台机器可以跑满所有的软件,这个是毫无疑问的客观事实。
在这三个核心能力之上,我们还有中国最大的开源大模型的社区,目前整个开发社区的下载量已经超过了4万个,围绕阿里通义家族系列的开源大模型,在全球范围内衍生模型已经超过了10万个。我们发现很多地方的协会组织,拉着阿里的同学一起下企业下行业调研,调研的时发现40%到50%的企业,已经是阿里通义大模型的客户,因为基于
开源,基于自己做的很多事情。当然我们在行业也做了很多的案例的落地,我们在福建做得还远远不足和不够,机遇和挑战并存,阿里也愿意跟福建很多的生态在一起共赢共建,把这件事做大做强。
最后做一个简单的总结,如我开场所说,今天阿里云在中国可以提供云+AI的能力的全栈解决方案,从我们基于底层的硬件计算能力到国产化通用的高性能计算到GPU计算到飞天的操作系统到大模型这些都是自主可控,且具有全球技术领先的能力。同时我们还通过原来阿里云在技术开发者的流量的引领,加上大模型时代基于开发社区的运营对人才的引领,加上持续的投入和行业伙伴的共建,我们向全行业向未来的福建,提供一个端到端的全栈的AI的技术能力,助力福建的数据产业发展,感谢大家!
(以上内容根据嘉宾发言速记整理)
扫一扫在手机上查看当前页面


网站地图