高文:AI赋能新质坐褥力发展
-
专题:2024中国高新工夫论坛
“2024 中国高新工夫论坛”于11月14日在深圳举行。中国工程院院士、鹏城试验室主任高文出席并演讲。
以下为演讲实录:
高文:今天我和人人共享的是“AI赋能新质坐褥力发展”的命题作文。
我讲两点:一是对于本年诺奖给了东谈主工智能,谈谈我的谈判;二是对于东谈主工智能发展目下我场地的鹏城试验室作念了少许东西。
当先看第一部分。
为什么本年的诺奖会给东谈主工智能两个,物理学奖和化学奖,它背后的逻辑是什么?到底是什么使得这两个奖临了找到了东谈主工智能?可能人人不知谈,背后的逻辑是科学大奖赛,是靠比赛临了选出了获奖东谈主。
先说问题,这一轮东谈主工智能起来,是深度神经齐集。要想凑深度神经齐集的吵杂,那一定要给作念深度神经齐集的东谈主一个奖,到底给谁?临了给了他俩,给他俩的主要意义,Hopfield等于统计物理学家,后半生主要作念神经齐集,然则用统计物理学的顺序在参议神经齐集。右边这个和物理学没什么辩论,但他发展了Hopfield基于统计学的神经齐集,给出了玻尔兹曼机,是优化问题。优化问题是数知识题,但他用了Hopfield的模子,临了他拿了奖。获奖,这个领域少许问题齐莫得。化学也不异,把这个问题给了一个卵白质折叠的估量。右边两个东谈主(Demis Hassabis 、John M.Jumper)是作念软件的,唯有最左边这个东谈主(David Baker)是实在作念这个行业的。它是一个搭配,但这个搭配内部有相配深线索的原因。
诺奖很怡悦蹭热度,在上世纪70年代也有一个东谈主工智能的人人得诺奖,他(赫伯特·西蒙)得的是诺贝尔经济学奖。刚才陈院士提到,智能里很迫切的是推理,上世纪70年代的东谈主工智能主要在参议推理,参议推理时赫伯特·西蒙给了一个有酌量模子,要推理时临了要拍板到底哪个对哪个错,他给了一个有酌量模子。为了蹭东谈主工智能的热度,这个有酌量模子说在社会学里可以使用,就给了赫伯特·西蒙。
诺奖在捏一些在社会上影响相比大,可能会带动一个潮水的领域。
本年为什么给了物理学奖和化学奖?它的判断是由两个科学大赛引出来的。
第一个,物理学奖,实在折服要给谁的是由于ImageNet比赛(机器视觉比赛)。但机器比赛太绕口,这个比赛的数据库叫ImgeNet。这个图像数据库是目下东谈主工智能里相比闻明的斯坦福大学培植李飞飞领着学生作念出来的图像数据库,用这个图像数据库作念比赛。
2010年运转庄重比赛,全世界总计作念遐想机视觉和算法的齐可以来比赛,你说你的算法历害,是骡子是马拉出来练练。这个练是在大数据上练。ImgeNet这个图像数据库里有1500万张图像,内部有22000类目标或者叫物体。它给出一张图像,问你这图像里有什么,你就回话这个图像里有什么,你回话对了就不减分。比如这里有一只猫,你说是老虎,那你就错了,就扣分。谁扣分扣得最少谁就得第一。
2010年得第一的,他的失误率是28.2,2011年的失误率是25.8,到2012年失误率一着落了10个百分点,16.4。其时人人说你这个算法挺挑升念念,一下可以升迁这样多。作念科学参议的齐知谈,勉力一年能升迁一两个百分点齐可以了。他说我用了一个神经齐集作念的。从2013年以后饱胀是深度神经齐集,仅仅内部的层数不不异、建立不不异等等。
ImgeNet比赛2012年这个实现是深度神经齐集在诓骗中的第一滴血。若是你要找最根上的东西,那折服要找这个,是以AlexNet就被阐发为入围诺奖物理学奖最迫切的陈迹。Alex莫得得到这个奖,他的导师得到了,他的导师等于物理学奖第二位的Hinton。Hinton是深度神经齐集里辞世的最大东谈主物。深度齐集作念起来有三个东谈主相比要津,这三个东谈主是2006年区分各发表了一篇论文,告诉说深度神经齐集可以作念大界限的使用。2006年也被称为是深度神经齐集的元年。深度神经齐集这三个东谈主中Hinton是排第一的。这三个东谈主是不是齐要给?物理学奖天然可以给三个东谈主,但学生没给,光给憨厚,和憨厚无关的另外两个东谈主好像也不是很得当逻辑。就在这内部找,Alex导师是新的,他在这一轮神经采聚首孝敬可以,但和物理学没太大辩论,就要往前挖。Hinton在1985年写了玻尔兹曼机,1986年的BP齐集是今天深度神经齐集优化的基础模子,是以要给应该给他这个责任。但说还不可说这个责任,还要说玻尔兹曼机。折服了要给Hinton,但Hinton又不是物理学家,要给物理学家Hopfield,Hopfield齐90多岁了,他作念梦齐莫得预料短暂会拿到这样一个奖。
第二个,这个更挑升念念。前边阿谁是2012年的实现,2024年才给的奖。这个更快,卵白质折叠的估量短长常挑战的责任,正本作念结构生物学的科学家全世界大略能估量出1万个傍边的卵白质三维结构。但本色上生命界存在的卵白质大略有上亿,一万和上亿之间差了1万倍。若是按惯例顺序,要把总计卵白质结构贯通出来,要一万年的时刻,这是不可隐忍的。1994年有一个马里兰大学的培植提倡一个比赛,他说有莫得可能用已有的卵白质结构、已有的序列,去估量新的东西,因为它每年齐会产生快要1万个。每年产生1万个,先不公布,拿这个东西来比赛,望望谁的算法好。从1994年运转每两年就有一次CASP大赛,这个比赛前些年的实现不怎样样,2006、2008年估量的准备率齐在40%落魄,40%能估量对,60%估量错的,准确率很低莫得看法用。2016、2017年AIphaGo相配热,其时AIphaGo把东谈主类围棋击败,有东谈主问过DeepMind的CEO下一个目标是什么,他说我下一个目标是拿诺贝尔奖。那时候他照旧想明晰了他要干涉CASP比赛,而况他很折服,他在这个比赛里只消拿了冠军,他改日就可能获诺贝尔奖。这个年青东谈主的想法很不消婉词。2018年第一次去干涉他们的得分就快要60,一下升迁了快要20个百分点。2020年到90分,惯例的东西照旧价值莫得那么大了,这个的价值就相比高了。他一下把正本好多合成生物学的科学家饭碗打掉了,目下合成生物学的责任齐要转到怎样用这个东西了。
正因为这个责任,折服了背面这两位的奖。但背面两位不是传统意念念上化学领域人人,是以光给估量还不行,还要给卵白质遐想,要找一个东谈主来陪榜。是以第一个东谈主是实在作念卵白质遐想和估量的,主要作念遐想,三维结构可以东谈主工遐想,他得了一半。背面两个作念遐想机的得了另外一半。
这告诉咱们什么?科学比赛对于评价一个科学发现的价值,也短长常迫切的,畴昔齐说论文迫切,因为论文需要千里淀,需要多量东谈主去援用。但你干涉这个比赛,就相配不消婉词,你把别东谈主击败了,那你就历害。怎样历害,你可以把它写成论文,但这个实现是由大赛产生的。
鹏城试验室是在深圳的一个国度试验室,齐集通讯领域。目下齐集通讯和东谈主工智能分不开,是以咱们也作念东谈主工智能诓骗。
为了作念这个东西,前些年咱们一直在作念算力,用算力支持东谈主工智能大模子的考试,是以咱们作念了一个鹏城云脑2,这个机器的性能相配好,在存储性能方面衔接八次赢得世界超算比赛榜单,衔接八依次一,而况它在东谈主工智能性能榜单以及东谈主工智能图搜索榜单上齐是发达相配高出的。
这是4096块卡用华为昇腾芯片作念的机器。(见PPT)
这个机器作念出来后,国内好多大模子齐是在这个机器上考试的,包括人人接续听到的华为盘古,它早期的版块齐是在这个机器上考试的,也包括百度文心,还有像北京智源的模子。
咱们开源了好多东西,也有一深广,包括丝路、大圣、扁鹊、通言、通图、常羲等等。
这台机器从2020年10月份上线到目下差未几4年,4年运行下来,机器的使用率相配饱胀,90%多的使用率。其中大略唯有一半48.27是试验室我方使用,剩下大部分齐共享出去给互助单元以至公益机构使用。
(短视频播放)
这是2020年时。
咱们这个机器上线后考试了一批模子,线上开源社区里有好多咱们的模子,包括7B、33B和200B的模子,有酷爱的齐可以到哪里下载。200B的模子是相比典型的任务,花了差未几7个月时刻,用整台机器,这内部的3456卡作念考试,另外的作念数据整备和考证。这个模子考试出来其时也相比可以。
这些模子齐是用开源时势作念,是以可以作念多样千般的互助。
这是云脑2,正在作念的是云脑3,云脑3的算力是云脑2的16倍,内部用了2万多块最新华为的卡,每一块卡的算力异常于H100确当量。
这台机器的原型照旧完成了,咱们在原型基础上运转作念视频内容的生成,用Open-sora跑,可以生成几十秒以至几十分钟的视频。背面等于生成一段内容,人人可以看一看。
(短视频播放)
刚才陈院士说科学无国界,地球上的科学家齐应该相互互助,其实外星球的也不异。
科学大赛相配迫切,鹏城试验室这几年在深圳市科创委的组织下,咱们也搞了一个世界东谈主工智能大赛,这个东谈主工智能大赛照旧举行了好多届,每年齐有几千个军队来干涉比赛,本年还会有,但愿人人热心。
科学大赛对于科技效劳的评价有很迫切的作用,中国的东谈主工智能大模子要有我方的底座、算力,这样智商承载咱们想作念的智能和中中文静的传承。对于这样一些生态,但愿人人热心,谢谢人人!
新浪声明:总计会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目标,并不料味着赞同其不雅点或证实其描述。
海量资讯、精确解读,尽在新浪财经APP背负裁剪:梁斌 SF055