来源:New Economist
本文为2024世界人工智能大会暨人工智能全球治理高级别会议“AI 规模新经济”--投融资主题论坛的讨论实录,由新经济学家智库整理,有删改,未经本文确认。
本账号接受投稿,投稿邮箱:jingjixuejiaquan@126.com
朱云来、吴军对话:人工智能下一步
王曙光:尊敬的各位嘉宾,各位朋友,下午好,欢迎来参加中金公司的论坛,也很欢迎能够来参与我们这次讨论。(王曙光为中金投资银行业务负责人)
我作为本次高端对话的主持人,首先向各位介绍一下今天的两位嘉宾,一位是坐在我左侧的朱云来教授,朱云来教授以前也是中金公司的CEO,现在是清华大学的访问教授,然后线上还有一位吴军博士。吴军博士好。
吴军:大家好,主持人好,很高兴跟大家在线上(交流)。
王曙光:吴军博士是人工智能方面的专家,也出了很多跨界的书籍,像浪潮之巅这些特别有名的这种科技的畅销书。特别感谢吴军博士在美国线上参加,此时已经是美国的深夜,但是中国人工智能的这种热度,相信能够使得吴军博士能够打起精神参与我们本次的高端论坛。
在开正式开始论坛讨论之前,说点题外话,我刚才听了彭博(彭文生)的报告,我觉得未来有一个职业大概率会被替掉,就是像我这样的论坛主持人。我觉得未来我可能是少见的一些还真能够现场参加的主持人,因为我说主持人一般在干嘛?
第一,搜寻社会上的热点问题,其实这一步工作只需要用ChatGPT或者是用中国的这些大模型,你输入几个字,现在社会上最关心AI,尤其是比如说经济界或者投资界最关心有哪些问题,一页纸出来了,然后这个问题有了。未来像中金公司的那位,我们的智能员工,他就可以直接在那,用比我更好听的语音和嗓音,然后来问嘉宾们问题。
第二个就是问问题,问完问题之后基本上作为主持人要总结归纳一下嘉宾说的什么话。这个刚才彭博士的报告也讲得很清楚,包括刚才萨金特教授也讲得很清楚,归纳并复述,这个是人工智能最基本的一些功能,这个东西也被替代了。
第三,那就是引导嘉宾们讨论,甚至是争辩。这也是人工智能特别擅长的领域。所以我说今天有可能是人工主持人在上海人工智能大会上的最后的演出,所以希望明年人工智能的进步能够使得像我们这样的人就不要出现了。因为我说像我们现在还需要人工主持的主持词对吧?这些其实都是对社会资源的浪费,明年希望咱们的主持能够变得更加人工智能一些。
我觉得第一个问题还是先请吴军老师来帮我们分享,因为实际上人工智能技术经历了从简单规则到深度学习和神经网络的快速发展,在这个过程中 AI技术已经广泛应用到各个领域,如今在图像识别、自然语言处理和预测分析方面已经显示出了强大的能力。
近年来,包括在自动驾驶、医疗诊断、金融、教育、创作也都有很多的应用,还是首先想请吴军博士和朱教授分享一下,你们作为行业达人是怎么看待AI技术的演变及未来应用的这种真实的潜力?先有请吴军博士。
吴军:我谈谈我的看法。人工智能到发展到今天基本上是第四波的浪潮或者是第四波的热捧。
第一波其实是从有计算机开始,到60年代初。刚才主持人讲了说用一些简单的规则来做人工智能,当时人类的想法很简单,就是人怎么思维的,就是我们要怎么做人工智能,当然后来证明这条道路行不通的。
这就如同人类发明飞机的时候,其实它不是学鸟在飞行,不是在振动翅膀,人发明的飞机的翅膀是不振动的。人类搞清楚了空气动力学的一些原理,在这个基础上他又发明了飞机,这就能做的比较好了。但是整个第一代人工智能时代,人类完全不知道机器来实现人工智能该怎么做。
到了上世纪70年代其实是美国的一个教授,后来是IBM的一个负责人,就是贾里尼克教授提出语言模型,这才开始了数据驱动的人工智能,但是由于数据量不够,计算量也不够,一开始其实成果不是很能让人信服。一直有争议,就是说按照这条路能不能走下去,有一些问题能够得到解决,有些问题解决不了,中间也起起伏伏,这就是第二波的浪潮,起来又下去了。他的那些同事,后来其实除了他自己还在做人工智能,剩下来人都去了一家非常有名的,中金大概每个人都知道的一家公司,叫做文艺复兴技术公司,都挣着大钱了,用人工智能的技术去解决语言的问题、图像的问题,都没解决好,最后做股票预测挣到大钱了,当然这是题外话。这是第二波热潮起来又冷下去。
在这个时候又出现了第三波,今天的人工神经网络用的这个,但是也是受限于规模,受限于这个数据,也没做好,所以在2000年的时候,大家都不好意思说自己是做人工智能的,因为你说这个一定找不着工作,大家说自己做机器学习的,就是这糊弄事了。
这时候就出了那几个人,就是本杰欧、杨立昆和新的他们几个人搞人工神经网络,把很基础的算法给搞出来了,但是没成果,而且他们甚至也不知道为什么要做这些东西,觉得这些算法很好,非常好,非常有意义,说有什么用没人知道。
直到后来Google这些公司有了大量的数据,有了大量的计算能力,然后实现了深度的人工神经网络,这才开始其实也就是从2010年开始做,2016年取得初步成果,后来又提出了今天我们的transformer这一套,把人工智能问题然后变成一个深度学习的问题这样一套方法。
那么在这个基础上有了今天ChatGPT,大家从2016年其实人工智能开始热了,因为当时阿尔法狗赢了李世石,在中国有了很多的应用,主要是人脸识别,在世界上无人驾驶现在也很靓丽,那么然后有了ChatGPT解决了语言学的很多问题,今天人工智能才热起来。
实际上从它的发展的时间来看,以及它的成果来看,也就是发展了60年,大概它的成果集中在最近的十年。所以人工智能其实还是处在一个相对早期的阶段,它做了一些事情,但是和它未来的潜力相比发挥的还非常小。
在未来的时间里,我们刚才讲了这4个阶段,今天这个阶段其实是其中的一个阶段,如果大家觉得说这一个阶段能解决什么问题,我觉得过分乐观了,还有好多问题其实没有解决。
刚才我听了前面的几个报告,比如说是否让人工智能来模拟人,其实这种想法一直有,但其实到现在为止解决的都很不好,非常的粗浅,所以人工智能还有很大的潜力,有很长的路要走。今天做的在很多领域其实超过了人已经很不错了。
刚才我也就主持人一开始一个自谦的说法,说是不是将来就没有主持人了。其实人工智能他擅长回答问题,不擅长提问题。世界上不光是人工智能,世界上最难的事情是提问题。
我问过很多最优秀大学教授,世界一流大学大教授,也跟国内一些一流大学的教授们讨论过,最后大家有一个共识,像MIT或者斯坦福这些大教授或者能得诺贝尔奖的这些教授,他们跟我们国内的清华或者复旦这种一流的教授比有什么差别,或者差距在哪里?差距在于提问题,不在于解决问题,也就是说国内一流教授解决问题的能力不比美国这种顶级的世界顶级的教授差,但是能够提出好问题是非常困难的事。所以我觉得在今后像我这样回答问题的人可能就不存在了。提出好问题的人永远是很稀缺的,先跟大家分享这些。
王曙光:谢谢吴军教授,突然间使得我们在评价资深员工的KPI上多了一条,只有能够提出好问题的老板才是好的老板,现在看来是应该这么有一个向上评价的额外的KPI,我把这个问题再转给朱教授,请朱教授做分享。
朱云来:很高兴能参加讨论,吴军博士是业内著名的专家,他写了可能得有几十本书,我记得当时有个什么叫《浪潮之巅》,后面一系列的,我这个充其量算一个业余爱好者,不过是一个非常热情的追随者。
其实粗算一下历史,刚才吴军也讲了大概有4代,算一下,如果我们把图灵当时他破解密码应该也算是人工智能了,对吧?从那个时代到现在,1945年二战结束到今天2024年差不多也是80年,80年4代,一代20年,其实跟我们人类的迭代也挺有点像。但是浪起浪伏,一次都是给你带来特别大的一个希望,如果你去翻一翻历史上他们当时宣称离人工智能有多近,你会感到非常的激动,但最后他又过去了,好像远远没有达到这个目标,但是过一段时间突然又崛起了。
怎么看这个问题?我觉得这一次,第四次,特别是去年ChatGPT的崛起,应该是说给了我们一个前所未有的一个崭新的感受,又让我们重新燃起了对人工智能的期望和好奇。
我觉得它确实是一个非常大的进步,其实是显示出来我们人类可能逐渐的在找到这个感觉。从最早的计算机的设计利用变成了更多的去模仿人类的能力,到现在我们好像找到了一点感觉,其实可能每一次我们都是想的是一个非常完整的、高水平的综合人的能力,但其实从经济学的角度,其实你不需要完成所有最高的,你能把大量的、基础的能够非常有效的推广以后,他可能已经能让社会经济大大的前进一步。
我比较一下这一次有可能一个潜力是说达到一个工业革命级的是吧?比方说过去有蒸汽机革命,这算是第一次工业革命。它其实只是系统的潜在的能源的供应,以及能源的成本降低,所以它实际上就是推动了全世界的经济发展。第二轮典型的是电力,还有好多各种专业性的革命。这一次我为什么觉得就是说人工智能有了一个新的特点?
在过去你想想,从计算机发明到后来的一系列的应用,计算机概念,说到底它就是一个芯片,它可以接受指令来完成各种具体的操作。但现在慢慢的我们把它越来越系统化了以后,我发现这一轮的 AI如果说跟以前的各种各样的计算机的应用相比的话,它好像多了一个特点,它是能够自己来执行,它是以完成某一个任务为核心。
过去只是说你让我开关,你让我开这个我开这个,你让我开那个我开那个,然后剩下的事情还是你人类做的,但其实现在我们已经总结到一定的程度,就是说我可以给他一个指令完成一个功能,甚至说是指令都不用给了,我想要达到一个什么目标,然后你计算机自己去组织你的一些指令,变成了完成的任务。
所以这一次的话,我们又发现比方说通过像GPT这样的,他用了所谓大量的语料,这个语料它其实本质上应该还是神经网络的概念。神经网络实际上是说这里边的参数,原来我对这个参数理解可能有点不太准确,我也是在一路在学习。
原来担心,你看GPT第一代上亿的参数,接着第二代就10亿,然后第三代百亿千亿,到第四代万亿级的参数,我当时觉得这玩意有点太快,这么一个大概3年多4代这个参数就上一个量级,我说这个是不是有点反摩尔定律?摩尔定律是说每过一年我成本降低一半,你这个是说每过一年成本上升10倍,上升了一个量级,是不是有点这个问题?后来我发现不是,这个参数它本质的意义是说我们的神经网络的复杂性,它其实是我们的权重系数,最近新出来的好多 GPT开源版的,那就变成什么7B了13B了,7B也就是70亿,比原来到什么万亿千亿的水平其实小了很多了。
所以可能是说你要用一个多复杂的神经网络系统来才能够去理解总结这个世界,可能我们现在也找到这个感觉了。
另外一方面就是说,我们要认识的世界的对象,实际上就是我们的语料一个trillion还是多少个trillion,就是万亿,多少个万亿的要被认识的对象,这些逐渐的是在我们掌握之中了。
但是现在的人工智能还是有一个本质上的问题,就是说它,不是有一句话叫做什么,一本正经的胡说八道。为啥?其实后来我看了一下,神经网络的本质,它的背后实际上它是在不断的概括归纳这个规律,其实刚才萨金特教授也提到,我们实际上是怎么兼容了一次,然后怎么去拍成MAC内审,所以它其实本质上还是一个模式识别,而且它识别了以后它就不分真伪了,普遍运用,所以它很一本正经,为啥?因为它都是一个计算机的算法模式出来的,所以他一本正经,然后胡说八道,实际上是什么?他可能90%都是对的,但是有10%也是错的。但它也把那10%的错的也当成对的照用,所以也就变成好像有点信口开河了,或者我说他这种学习方法,其实这是对世界的一个学习,他有点生搬硬套,但是至少我们现在发现,因为我看到GPT回答的速度和他回答的合理程度,这是惊人,我都是奇怪这机器怎么能做到,但是后来我想想从方法论,从科技框架来讲,这个还是一个很重要的进步。
其实下一步我觉得我们需要的是,你把这个可以看成是一个学习,是照猫画虎,我系统的学习。计算机他学得快记得牢,所以他能够大大的超过个人思维的水平,而且它互相之间是可以整合的,所以它效果就更大。
做完这一点,但是还是有错,你不能把你所有的都这么如此推论,所以后面可能就需要一个证明,你90%的归纳观察,可能都是对的,但是有10%不对,不对的东西你怎么纠正?
你要证明,比方说你潜在的从归纳里边得出某一种规律,但是你下次你说我要证明一下你这个规律是不是确实的,是不是真正存在的。过去计算机证明其实是有一个很著名的四色定理的计算机证明,反过来说,如果你完成了证明这一层了,你再去推演、推理、推断,你都是对的,你找来的根据都是对的,你再继续推断。不断的推理,扩大人类的知识,触类旁通,由此及彼,它又是比人快得多对吧?
最后你想想,其实计算机你只需要模拟一下我们人类的intelligence,刚才萨金特教授也谈了半天,就说如何定义 intelligence,其实什么是intelligence,就是一件事儿你怎么做,你能做什么。比方说我归纳我先弄一大堆,然后归纳出来以后,但是这归纳是一些似是而非的定律,然后我来证明,证明以后,我再拿这些我知道的证明了的定律,再系统的再去推论。所以其实这样我们很快能够build一个很大的我们的理论体系、知识体系了。所以从这点来说,我觉得计算机应该是有很大的希望往前走。
这个简单说一个问题,就是刚才萨金特教授也提到,它对人类的替代的问题怎么办?待会我们有机会我们后面再讲,但至少说前景, AI可能是会给我们带来确实一个很大的科技的提升,这对我们的经济的发展,对我们经济的往前跃进应该是说很有潜力。
当然他现在还有很多一些问题,包括多重投资,大家所有人都巨额的去投资,这个方法是不是最好,也是值得商量,然后它可能产生的对社会替代的问题也是一个潜在可能我们需要考虑的,我先提到这儿。
王曙光:感谢吴博士和朱教授的分享,其实我都发现他们的观点中其实很隐晦的反向提出了一个问题,就是人工智能现在的发展到底是不是真正能够做出很多对人类社会的福祉更加突破性的事儿。
因为实际上刚才二位都提到了,人工智能目前的基础设施的投资,现在有点军备竞赛的感觉,我们的同行高盛也是说,预计要达到一个比较良好的使用基础的话,至少是1万亿美元的投资,可是1万亿美元的投资到底能够产出多少,尤其是刚才彭博士也在他的 AI经济学中讲到了,中国在应用侧历史上弯道超车的可能性更高,现在AI如何与应用更好的结合,如何能够快速的来提高真正投资AI的这些公司的收益和利润率,这点的话,这个也想听听两位嘉宾对这个行业的一些建议,先请吴博士您来分享分享。
吴军:刚才您这个问题是非常好的一个问题。
刚才讲1万亿,这1万亿我是这么想的,他这1万亿并不是一个夸张,他这个投资并不是说我今天投1,000亿,明天投1,000亿,最后投了1万亿以后才有效果,他是一边投一边会产生很多效果。他有时候是会把自己挣到的利润,比如说投资人工智能挣到的利润再拿去再投资,这么算下来1万亿,这是一个合理的估计。
1万亿美元,当然对很多人来讲说这是天文数字,但其实你跟一个国家GDP比,全世界现在GDP100万亿对比,其实科技公司的投资其实也不算太高。刚才您讲的时候我正好把我原来的一个笔记拿出来看了一下,2022年美国几大的科技公司,他们的研发投入多少?亚马逊大概是580亿,第一。Google460亿,第二。然后苹果300亿,微软的270亿,光是这4家加起来已经是,大家可以大概加一下,一千三三四百亿,这是一年的投资。你要说有个十年下来,这几家公司投资都已经超过1万亿了,当然它不光是投资在人工智能领域,还投资在别的领域了。
在历史上,可能在座的做投资的应该有体会,在IT领域的投资,历史上基本上是投一块钱能挣三块钱。在有一些国家,像中国当时是做的比较好的,大概就是投一块钱挣三块钱基本上能做到,非洲可能差一点,你电信的投资一块钱可能能挣回两块块钱,但基本上也是挣的。就是说全世界很多投资它不一定能够把成本挣回来,包括房地产的投资也都不一定能挣回成本,但IT投资从长远来看,从宏观来看,这个钱是能挣回来。所以我相信虽然在人工智能上的投资看似很多,其实你看单笔投资最大的一笔是微软给OpenAI的投资,大概百亿这个量级,当然也就仅此一笔了。
Google给安卓PK这些投资规模要小很多,加起来和我说的大公司内,他们自己的IT的投入来讲,其实还是小头,所以我觉得现在投资,估值有很多泡沫,但是你说投资真的投的钱是不是已经过多了,我倒不觉得。
但是现在的问题是什么?投资有点太分散。以咱们国内为例,大大小小的自称自己在做大模型的,肯定有超过上百家,因为我看有些榜单说前50家怎么着,你既然说前50家肯定还有后面的,大大小小已经上百家了,有的投资就是一两亿人民币。一般的风投一两亿人民币不算少了,在 AI上今天投资一两亿人民币,其实做不了什么事情。
所以我觉得,我们现在实际上可能需要国内一些,尤其像国家队这样的大的一些基金,重点的扶植若干家,就是不超过10家,因为这本身是一个很烧钱的事情。就是刚才前面也讲了电力的消耗,这还是第二位的,比如GPU现在很贵等等这些,这些我觉得是第一个梯队,就是说重点的可能投资个位数不到10家,然后大部分应该鼓励大家做一些辅助性的工作以及一些具体的应用。
比如说,刚才我们都谈到了数据,今天很多都在讲我们怎么建模型,但是很少有人讲我怎么能够为各家大模型来提供干净的可靠的数据。数据的质量差,训练的模型就差。在硅谷有一家很成功的做AI的公司叫coAI,它其实不做任何AI的模型,它就是给AI提供数据。它包括制造很多工具,让人很容易的来判别数据的真假,它就有很多这种相当于人工的审核的这样一些人,他能把全世界的组织起来,这也是很不容易的一件事情。
还有很多的应用,像现在比如说我们有开源的大模型,你拿来用其实就省了很多的训练时间和成本,我们能够运用到各行各业去,你今天用到医学上其实还是蛮少的,大家很多还是在文本这个领域,就是说让他写个文章回答个问题,因为演示的效果比较好,医学上演示的效果不算那么好,把它应用到医学上,应用到我们很多工业的管理上等等,就是说有很多的应用的场景,我觉得我们很多投资的也好,创业的也好,应该更关注这些领域,当然关注这些领域也就需要大家深入到各行各业去了解各行各业的情况,就是说我们获得叫做knowledge,就是关于各个行业自己本身的这些知识和解决他们的问题。所以我觉得说今天看似有点过热,也确实是估值上有点过热,但是从投资来讲是我们目前各国的社会是能够承受的,而且我也相信各国的政府和投资领域的这些基金,还会在未来的大概10年内还会继续大力的来支持支持人工智能的发展。
王曙光:好,谢谢吴军博士,我听明白了,您的意思是尽管这个行业目前看上去有些过热,但是实际上投资按照目前看还是相对理性可控。其实刚才您也提到了关于能源的消耗可能是一个问题,朱教授是著名的碳中和方面的专家,其实也正好把延伸的问题问一下。您怎么看待,包括刚才彭文生博士的报告中关于,随着技术的不断发展,尤其是AI的发展,对能源的消耗反而好像更高了,因为尤其是AI,它反过来创造了更多的人对 AI的发展之后产生的这种额外的新需求。是不是出了AI之后,反而还会减缓碳中和的脚步,因为全球并不是什么国家都能够拥有比较好的清洁能源的供给。
朱云来:这个问题非常好。其实我正好借这机会给大家提供一个宏观的基本框架,包括刚才吴博士讲,吴博士我知道他做了很多AI的投资,这一方面应该是很专业的,我是从一个宏观的角度也给大家提供一点这种概念的支撑,这样就会更容易理解。
我们讲到这个是1万亿美金的全世界的投资,就是AI的投资,但实际上全世界的目前大致的水平,GDP的水平是100万亿,平均的投资大概百分之一二十,投资占经济总量的占百分之一二十,然后中国占的比例比较高,因为中国历来投资的占比很高,可能到高到40%,GDP的40%是投资,但是从全世界平均来讲,就刚才说了一二十,那么也就是说1、20万亿,100万亿的基础,其中可能1万亿,而且刚才吴博士也解释了, 1万亿不是我现在一下投1万亿,这1万亿可能我投了3,000亿,在这个过程中间明年产生点利润,我继续把利润的一部分再投进去,这样累计,我不知道他具体怎么个算法,但是总而言之,就算是你全部都拿新的出来投,也不过就是这个比例,应该也不能算多对吧?
然后刚才曙光讲到的我们电力的需求,我确实看到很多这种估算,我自己也在试着估算一下,全世界我算了一下,以全世界现有的芯片,它不是有个功率嘛,你比方说多少个芯片,比如说你的芯片是多少几百瓦,然后我假定你把全世界芯片全部加起来,全部天天都在运行,你要花多少电?
好,我们算下来,初步的估算,一个是5,000亿或者到5,000亿到1万亿度,这又是一个什么概念?全世界现在平均总的用电量是30万亿度,中国是差不多将近10万亿度,三分之一,9.5万亿度,所以你按照这个来算的话,那么它其实是1/30的全世界的电耗。不算小,但也不能说是灭顶之灾。
另外我们现在在做的双碳,就是刚才曙光提到,我们经常也会讨论一下这样的基本问题,我现在认为,就是说至少根据我们的科学的计算,现在我们用光伏基本上加上电池,可以用光伏加储能的办法能够基本上替代,百分之百的替代火电。当然实际的替代过程是通过一个自然折旧的过程,20年,那么自然就可以把它替代掉。
如果是基于这样的话,也就是说全世界的这30万亿度电,将来我们全部都可以用光伏来提供,所以它都是绿电,你不用担心,然后其中大概按你刚才估1/30,当然,我们估计的是现有的芯片,将来你要如果再涨个5倍10倍的话,可能就占比再高一点,但是这个也不是说不可承受。
王曙光:谢谢朱教授给我们的吃了颗定心丸,3%如果是未来5年double也就是6%,按照我国现在太阳能电池这些大的几家厂商的产能利用率,如果我没记错的话,翻6%正好把他们的产能利用率提高到百分之百,我觉得这个看起来二级市场应该还会有更多的机会去买电池厂商,我觉得这是一个很好的消息。
另外的话往前看,我还想问吴军博士,因为全球并不是所有的国家,都有很好的清洁能源的供给,但是3%说大不大说小不小,因为它可能就在边界上的增加,就会导致一个国家的能源系统其实出现一些问题,因为还包括电网的问题,到底您觉得人工智能对能源行业的冲击中短期会是一个什么样的情况?
吴军:我觉得这不是一个太大的问题。刚才朱教授做了一个已经量化的分析,我再补充两点。
第一个就是说现在的人工智能或者说基于这种大模型的人工智能,大模型实际上全世界就是成规模的也没几家,美国有这么几家,你一个巴掌基本上,两个巴掌最多,数出来了,欧洲基本上就法国的一家,然后中国有几家,加起来,它不会全世界都去,每个国家建一个大模型,这是不会的。就像很多今天的IT服务,你比如说我们的5G标准,你不会每个国家都根据5G标准做交换机的。
这大模型最花钱的是训练,它又分两个,一个你把数据变成模型,这叫训练。训练一次我问过Google里头的人,大概差不多Gemini他们新的版本一次大概是几亿美元,里头当然很多是耗的电了,训练一次他不一定成功,可能训练废掉了。像前一阵OpenAI就有一个版本训练废掉了,大概差不多10亿美元这就打水漂了,这里头很多是电钱。
你真正的用来运算的花的电,就是说来服务花的电没有那么多,所以从各个国家来讲,你训练出大模型来讲,我估计也就是中国,美国现在还有一个欧洲主要是法国了,这几个国家训练出来,包括日本其实都没有,其他人拿来用了,所以我觉得对电的冲击不是很大。
第二个现在训练或是服务,它也不是在个人的计算机上,或者说哪个政府的什么小的数据中心上,它都是这种超级大的数据中心上,全世界一共也就那么一些家大公司有,今天数据中心一般要么建在水库旁边,就是水电站旁边,用的也基本上已经是清洁能源了。再要么就是像比如说阿里巴巴,把它建在特别冷的什么内蒙古这种不太需要空调的地方。总体来讲,数据中心在能源的使用上,在今天来讲还是相对比较绿色环保的,所以我觉得这个不是一个大问题。哪怕比如你日本要用大模型,你可能也是租亚马逊的机器,亚马逊的机器是修在几个大湖的边上,用水来冷却用的水电发电,所以这些我觉得不是一个问题,因为它并不需要每一个国家都来修这个,就是做训练自己大模型或者修建这种大型的数据中心。
王曙光:好的,谢谢吴博士您的回答这跟刚才朱总的回答确实是给我们很清晰的一个指引,今天最后一个希望分享的问题。目前的全球AI发展其实特别的火热,但是我们也看到中国的AI面临着诸多挑战。一方面就是美国AI的大模型算力芯片和数据质量确实都比中国目前的情况要领先,尽管我们也在大力的发展国内的算力芯片,积极研发自主大模型,期望能够借助我们的大规模的市场,就像刚才彭博士说的,我们在应用的环境侧的机会更多,也希望能够利用目前政策支持以及互联网时代积累的这种人工的红利,然后来实现超越。但是实际上目前我们的产业发展还是受到一些的掣肘,需要更多的资本,人力和物力的投入,在这块上,在中国人工智能发展的面临着这样的一种挑战和机遇并存的情况下,从国家层面到底应该如何去应对,包括从行业侧怎么去应对,还是想想听听您二位专家的的分享,还是先有请吴博士,请您来分享一下。
吴军:谢谢主持人,今天人工智能发展基本上离不开三件事儿,第一个是算力,第二个是数学模型,第三个是数据,所以从国家层面就是说我们制定人工智能政策,其实把这三件事做好就可以了。
今天一说到算力或者说芯片,大家都会想到英伟达的芯片或者AMD的芯片。实际上最高端的在禁运,次高端的没有禁运,这两个差一代,但速度可能差4倍大概。首先这4倍不是太大的影响,就不是那么致命的。第二个更关键的,其实你如果看美国的就是各大公司的使用的芯片,当然英伟达的用的是最多的,这没问题。但是人工智能这个计算它是一个特定的计算,它不是个通用计算,这也是英伟达的芯片比英特尔的芯片更有效的一个原因,就是它是特定的计算。特定计算其实比GPU更有效的是做专用芯片,比如Google他们做的叫TPU就是专门为 test flow做的处理器,就是说做特定运算,它其实单位能耗的计算能力比英伟达这种还能高出大概至少一个数量级,大概这样的, Facebook他们也在做自己的一些芯片。
所以我觉得就是说我们从国家层面来讲,除了大家投资做 GPU,现在很多企业在做,需要及早的研制专门针对人工智能算法的专用芯片,因为这些专用芯片一旦研制出来以后,他们的单位计算量的能耗是比 GPU高,就是有效的多,就是一个很简单的例子。就是说大家做的比特币的计算的时候,一开始是用GPU来做,后来专用芯片来做,这个效率要比 CPU高的差不多两个数量级了。这是一个。
第二个就是算法。算法今天其实国内大部分大模型用的是LLaMA,就是 Facebook,Meta的开源的这一套软件,这条路我觉得可以继续走,但是同时需要就是说这主要是从国家对科研机构的投入,像大学这种来研究,在更基础的算法上做更多的研究,而不是简简简单单是说这个直接照搬开源的算法。因为开源算法现在只能讲笑话,就是说 Facebook半年更新一次,大家就是说和Facebook的差距差半年,如果他得什么时候两年更新一次,你不能说这差距反而变成了差两年。
所以我觉得这不是资本市场的投资,是国家科研经费的投资,对那种基础算法的投入。国内现在自主的大模型做的比较好的几家创业公司,好几个都是清华的教授和毕业生出来办的。有一个原因就是说他们对算法吃的比较透,这是我觉得很重要的原因。还有一个比较好的,比如像阿里巴巴他们做的比较好,也是因为对算法本身吃的比较透,所以这是一个。
第三个是数据,国内自己有很多数据,但是在英文世界的数据可能更多,前面两个主讲人其实也提到这一点,我觉得这就讲到一个网络的开放,就是说我们还是要构建一个开放的网络,然后尽可能的把全世界的数据都拿回来,这是一个很重要的事情。
大家还有一个忽略掉一件事,就是数据本身原始数据有很多噪音,我们需要做标注等等这些,其实是在国内这是有优势的,就是说这不仅仅是劳动力成本的便宜,也在于过去我们来管理大规模的人工来做这些事情的时候,以前在做比如说图像识别的标注等等这些方面的时候,积累了很多的经验和很多的工具,这个我觉得是一个优势,这也应该继续发挥。
基本上今天人工智能就是这三方面,芯片,然后算法的数学模型以及数据,投资和国家支持也应该集中在这三个方面。
王曙光:谢谢吴军博士。下面请朱总。
朱云来:刚才吴博士已经讲了很完整,我再稍微补充一点,他提到的三大要素,算法,数据,算力。
我想特别强调一下算法,大家肯定也听到过很多一些讨论,比方说开源还是闭源是吧?其实这个算法里边还有一个很重要的,它其实最终是说,还需要一个社会的共识,所以其实最终是连到一个立法问题。比方说你的一个自动汽车自动驾驶,你说起来是个算法,实际上就是说这个算法是不是大家公众都接受的,如果遇到紧急情况对吧?第一选择什么,第二选择什么,第三选择什么。你的整个避撞的顺序,其实最终是要掺入很深刻的社会的共识和讨论。所以它其实还有一个立法问题,那么这个数据当然就是说你有足够大量的数据你才能训练好的模型,然后你要有这么多的数据,你没有足够的算力是吧?你刚才也提到了关于能源的耗电的问题,刚才说耗电不是大问题,但其实这几个问题都还是很关键。
我另外再想讲一个更重要的角度,就是说你发现大模型似乎对社会贡献很大,至少还是很有用,大家也很有兴趣。但是其实它有一个最大的Challenge是什么?是商业模式。结果但是人家不收费,你只要有一家开始不收费,稀里哗啦全都不收费了。刚才说了还有一个平行建设的问题,就是重复投资,我一下10家、8家。中国这个方面投资的家数应该是最多的,在美国也是有10家8家,大家足够大的公司都得进,还有很多人想进,可能是经济上也没法负担起来,但是收费模式其实是非常难的, 包括从商业角度来讲,大家都希望可能闭源,然后希望能够有一个商业模式能挣钱,但其实这个商业模式是非常困难的。甚至因为它的困难,它变成了最后投资也困难,谁来投资呢?所以它其实商业模式的问题就引出了一个投资模式的问题。
咱们彭文生博士,我们中金研究部的负责人也是研究院的院执行院长,他们的研究讲规模效益,你规模效益包括是说你模型的存在是对公众效益更高,最后可能就需要更多的考虑是带有公共性的投资的模式,也许是通过公共和公共部门和私人部门的某种协调,来达到这样一个新的,这种巨型的像社会基础设施的投资了,然后你怎么才能平衡在一个合适的点上?既让参与做的人有足够的激励机制,又让公众能够得到绝大的收益,同时又能够让这种实战强度比较高的,相对强度投资强度比较高的,投资活动能够持续。
然后你从投资的角度,无论你是公共的还是私人的,你最后投资得有足够的效益。因为我们了解经济学,金融学,就是说你最重要的如果一个投资永远没有收益,就算是你有特别好的公共效益,可能也是无法持续的。
所以我们能做的是既对公共利益有很大的帮助,同时我还有盈利,盈利其实是意味着我们有持续提供这种公共服务的能力,甚至还有继续增加这种公共服务的能力,它的必要前提就是你还是要盈利。或者说盈利也是我们社会的一个衡量标准,刚才萨金特教授也提到,会计等等这些是一个衡量问题,就是说这是一个完整的一个体系化的考虑。
总而言之,我觉得现在其实我们应该是可以有能力解决系统的发展问题,能够更好的进一步的推动 AI的发展,以及变成一个普遍可以应用的能提升全社会的 benefit。我甚至认为,我们可以想到,忽然一天我们意识到,你原来也是学计算机相关的是吧?就是说因为我们从一开始一起工作,就会谈到,好像20年前的事了,就是说我们有了这样的一个科技的水平,我们能把这个做得很好。
这个社会其实我们需要的什么衣食住行,大部分东西我们现在都能生产,而且都能保证足量,甚至我们经常都太过剩了。你只要有一个好的计算机管理的程序,实际上可以把这个事情都安排好,你有合适的收入,你有合适的保障养老对吧?
这一切通过科技的实现的话,包括过去讲那么多什么数字经济了,因为它实际上还是提高了我们对整个经济过程中间的细节的了解和系统的统计,使我使得我们的整个管理更有效,这样我们可以希望不是说怕被AI替代了,是说你赶紧早点把我们都替代出去,这样我们就可以去享受生活,然后我们的机器系统可以产生出足够的供应,每个人都可以,那就是我们基本上是属于共产主义的感觉了,对吧?时间所限我就先讲这么多。
王曙光:感谢朱总描绘,包括吴博士给我们描绘我们面临的挑战,以及其实我们也不需要那么焦虑对吧?
因为实际上只要通过足够的投资,充分多的人才进入这个领域,我相信AI改变社会改变世界应该是在座所有同事的共识,但是我们更期待的是说在这样一个大的大潮之中,我们能够抓住机会做出好的投资,然后无论是企业还是投资人都能够通过这样的投资,我们在明年大会再开的时候,我们会发现我们周边有有更多的通过投资创造了价值,并且分享价值,获得成功的故事。
再次感谢两位嘉宾的精彩和坦诚的分享,希望对今天台下的所有的朋友你们的时间有所帮助,谢谢。
发表评论