编者按:围绕“计算·AI·未来”这一主题,清华大学计算机科学与技术系教授孙富春、华为云智能化软件研发首席专家王千祥、腾讯研究院资深专家袁媛和第十九届文津图书奖科普类图书《计算》作者吴翰清共同探讨了“计算”“AI”的定义,以及生成式人工智能的发展趋势,对人类生产生活的影响等。现刊登文章供大家学习参考。
人工智能大模型发展的新趋势、新变化、新挑战
主持人蒋涛:计算是人类文明的基础,没有计算就没有交易,没有交易就没有如今的现代社会。计算无所不在。当前,计算发展到AI时代,更是成为创新的主要动力。今天,我们邀请四位重量级嘉宾来给我们作分享。
首先,问一下吴翰清老师。假设一个人每天做100次计算,那五千年来地球上出现的所有人类的全部计算量会有多少?10的16次方。但是现在,一台现代计算机一秒钟的计算量就是10的16次方。那么,计算到底包含了什么?
吴翰清:计算,是当今时代最重要的概念之一。我们每个人每天的衣食住行、吃喝玩乐都离不开计算,所用到的工具背后也都有计算。即便如此,还有相当一部分人对计算的理解仍停留在“加减乘除”上。要知道,当今世界上每一秒所产生的计算量已经超过了人类文明史上计算量的总和。所以,我们不能再用简单的“加减乘除”去理解计算。过去,因为工作关系,我经常要跟身边的人们解释什么是计算,但又很难通过三言两语来说清楚。
那么,到底什么是计算?我认为,计算就是通过机器尝试模拟某一类事物,然后构建一套智能系统。比如,一些人们耳熟能详的科技名词,如人工智能、区块链、元宇宙,其实质就是一个计算系统,瞬间可发生亿万次计算。那如何组织计算、如何组织数据,就成了计算的关键。我曾尝试用简短的语言来说清楚计算,但最后,还是写了整整三十五万字的一本书,就名为《计算》。由此可见,计算是一个非常重要的概念,不是能简单说清的。而这也是我写这本书的主要原因。
主持人蒋涛:有的人说人工智能大模型就是第四次工业革命,请问孙富春教授,您怎么看待这个问题?
孙富春:近代以来,人类经历了三次工业革命,从蒸汽时代、电气化时代到信息化时代,目前正在经历第四次工业革命。那么,这次工业革命以人工智能(AI)、机器学习等技术的突破性进展为标志,能否引领人类社会进入一个全新的智能化时代呢?首先来看,大模型是以往人工智能的延伸,还是开启了一个新范式?要知道,人工智能历史上出现了三次浪潮,第一次是符号主义浪潮,第二次是数据驱动的连接主义浪潮,其核心是深度学习。这两次浪潮的范式都是开环的,而大模型是一个数据加知识加反馈的新范式,给人工智能的发展带来蓬勃生机。比如,大模型可以根据我们的需求生成文字内容和图片、视频,还可以进行多任务学习。但是,大模型要想实现大规模应用还有很多事情要做。比如,现在最新的ChatGPT-4在真正生成使用中还存在一定质量问题。一是如何保证大模型生成的质量,二是大模型的不可解释性可能会导致人们对其能力产生夸大幻觉,三是大模型如何实现终身学习、在制造业中如何实现具身。另外,第四次工业革命还在进行中,人工智能也在深入发展中,并不能说其就是第四次工业革命,而可以认为是其中的初级阶段。
主持人蒋涛:那么,现在大模型的上升空间还有多大?能写出像莎士比亚戏剧、《红楼梦》一样的名著吗?
孙富春:我们注意到,现在的大模型可以生成包含复杂背景、多角度镜头和多个角色的长视频。但是,它只是呈现内容,而并不能反映内容背后的价值观、抒发人类的复杂情感。也就是说,大模型要能真正生成一部名著,还缺少一个灵魂。
主持人蒋涛:随着大模型技术的发展,应用更加广泛,给各行各业都带来了巨大影响。那么请问袁媛老师,我们个人如何应对大模型带来的挑战?
袁媛:人工智能大模型发展到现在,大大推动了技术和产业的发展,深刻影响了我们的工作和生活。就我个人而言,它带来的效率大于挑战。比如在生活中,我辅导孩子写作文的时候,会帮助他与多个大模型对话,使大模型生成不同的写作思路和不同体裁的范文,以此拓展孩子的视野,启发思考,有效提升他独立写作能力。在工作中,作为研究人员,我通过大模型来快速获取相应信息、跟踪前沿信息,同时还用大模型为研究报告设计封面,节省了成本,提升了效率。这对于每个人来说,是一个非常好的趋势。特别是,现在仍在讨论中的一人企业,有可能会成为未来的一种新的创业形态。因为一个人的独角兽公司,其大量工作都需要在大模型的辅助下完成,从而更好地激发了个人创造力,更能在所擅长的领域实现自我价值。
那么,随着大模型的发展和应用,它到底会不会取代我们的工作呢?我们把大模型看作是一种工具,积极地了解、体验,就可以让我们的工作更有效率,也会让生活更有乐趣。同时,我们也要关注人工智能大模型带来的一些问题,如伦理问题、安全问题,对它有一个理性、客观地认识。
主持人蒋涛:大模型可以帮助我们提升工作效率,但也会取代一些工作岗位甚至行业。请问王千祥老师,您怎么看待这个问题,大模型会取代哪些行业?
王千祥:这个话题比较敏感,而且尚不明确未来趋势。之前,我们认为大模型会先取代那些智能化较弱、脑力劳动较少的行业,比如司机、外卖员。但随着大模型的发展,我们发现并非如此,反而是一些知识密集型行业,如程序员、插画师,更容易被取代。其中原因,我分析,大模型可以自主学习,而知识密集型行业恰恰提供了其学习所需的数据。也就是说,数字化程度越高的行业,被替代的可能性就越大。但事实上,所谓“替代”还有些言之过重,更多的是把大模型视为工具,提高工作效率。因为大模型本身是有边界的,还未强到能替代的程度,而且人们对大模型也有夸大的幻觉。所以,对大模型的应用,还需要人来把关,强调一种人机协同。比如,线上客服用大模型生成客户反馈后,要人为确认才可发出,程序员用大模型生成的代码,要人为确认才可入库,这才是大模型应用的更好方式。总的来讲,大模型会产生一些新的工作岗位,正如汽车出现以后,司机取代了马车夫,同时也会重塑一些工作岗位,并不是完全取代,正如人机协同,提升工作效能。究竟有多少岗位会受影响,还很难讲。就程序员这个工作岗位来说,可能传统意义上的程序员会减少,非职业的大众程序员会增多,也就是会用大模型写代码的人会增多。
主持人蒋涛:回到计算这个话题。有人说,计算机原来是以字节为单位的精确计算,现在是以token为单位的统计计算。想问一下吴翰清老师,计算大模型时代是什么样的?
吴翰清:大模型是一类计算系统,尽管没有脱离计算系统的框架,但确实带来了一些巨大变化。
主持人蒋涛:大模型算力的需求量是不是大了很多?现在,大家都担心电力供应不足,这是什么情况?
吴翰清:从人工智能大模型的发展轨迹来看,我们摸索出一个规律,业界称为Scaling Law,翻译过来就是规模化法则。也就是说,随着算力和数据规模的不断扩大,以深度学习和神经网络为基础的这一类人工智能大模型也会变得越来越“聪明”。这是大模型技术突然涌现出更高级智能的一个基础。但是,我们要清楚认识到,这个规模化法则其实相当于一个机器文明的原始人时代。如果把机器文明类比人类文明,那么今天的规模化法则就是相当粗糙的。比如,在一定算力和数据规模下,我们训练一个大模型可能需要上万块GPU甚至数十万块GPU,所要耗费的用电量相当于一个小型城市。而我们人脑大概一天只需要消耗25瓦,相当于一个灯泡的用电量。可见,机器智能在训练的过程中消耗了巨大的能源。这就是为什么我认为人工智能大模型仍处于一个早期阶段的原因。未来,人工智能大模型要在算法上进一步突破,由此探索走向通用人工智能的路径。对于规模化法则,就好比武侠小说中的段誉,他内功深厚,一招六脉神剑天下无敌。而在当今,我们可能还会有其他选择,就像是令狐冲,几乎没有内力,但学会了独孤九剑,也是可以无招破有招的。这就是我们应该去探索的新方向。
主持人蒋涛:请问孙富春教授,大模型的发展会给教育领域特别是大学教育带来什么变化?
孙富春:大模型在教育领域的应用,在最近一段时间被讨论得比较多。一方面,美国纽约州教育厅统计显示,在美国有相当比例的中学生,通过大模型写作文、做作业和完成考试。针对这种情况,很多美国中学教师表示,中学的作文终结了。另一方面,我国教育领域的科技公司正在努力使大模型给教育领域带来更多新的积极变化。这主要体现在:一是如何开展个性化教育,就是通过大模型对学生学习情况的分析,找到适合学生的教育方式;二是把教师从繁重的教学任务中解放出来,有更多时间、精力掌握学生的学习进展,调整教学内容和计划,编写相关教材;三是通过大模型有效开展实验教育。
主持人蒋涛:未来的教育形态会有重大变化吗?
孙富春:将来应该会发生很大变化。比如,我们在教学中运用全息技术把实验室搬到课堂上,让学生沉浸式参与实验全程,使其对实验内容、结果产生更加直观、深刻的感受,同时增加了师生互动。
主持人蒋涛:那么,我们获取知识的方式会不会有重大变化?
孙富春:大模型在教育领域中的应用,产生了一系列重大变化。比如,大模型技术渗透到教师普通话培训、考核等方方面面。
主持人蒋涛:刚才谈到教育。那么,大模型将会在哪些领域深化演进,还会给哪些行业带来深刻变化?
袁媛:目前的行业共识认为,人工智能发展的一个终极目标就是通用人工智能。我们知道,通用人工智能相当于人工智能具有了和人一样的思维、处事方式,可以在多个领域处理复杂任务。而实际上,现在的大模型虽然具备一定的自然语言理解能力,但在声音、图片、视频等多模态识别能力上,与通用人工智能还相差较远。从研究来看,未来人工智能大模型的发展方向,主要表现在,一是类脑智能,就是让人工智能像人类大脑一样去感知、处理任务。比如,马斯克的脑机接口公司为一位瘫痪患者做了首例人类大脑设备植入手术,这个人现在恢复良好,已经可以通过意念与电脑交互,实现下棋和玩游戏。其实,这是通过人工智能大模型把大脑信号转换成行动控制指令,也是未来医疗发展的一个重要方向。
二是AI与基因计算,这也是和生物学有关,通过人工智能大模型技术与生物技术的融合,在农业的生物育种以及医疗的癌症早期筛查、药物研发等方面,可以发挥更大的应用价值。对此,我感受很深。2023年,Google DeepMind发布了全新的AI模型,能够预测出7100万的基因“错义突变”,其中在成功预测出的89%“错义突变”中,57%是致病性,32%是良性的。而这里面仅有0.1%的变异,能被人类专家确认。腾讯的AI Lab也在做相关研究,攻克了单细胞测序数据分析痛点。为什么我感触这么深?因为我的朋友不幸患了癌症,第一次穿刺的时候取的样本量不够,又进行了第二次穿刺。而穿刺的目的就是做基因检测,但是在这一过程中,人是非常痛苦的。如果能进一步突破单细胞测序难题,那么对于未来的癌症早筛会起到很大的作用。
三是具身智能,是指一种基于物理实体进行感知和行动的智能系统。该系统通过智能体与环境的交互获取信息、理解问题、作出决策并实现行动,从而产生智能行为和适应性。比如人形机器人,Figure研发的全尺寸人形机器人Figure 01,能听懂人类语言,执行指令,可以做很多任务。我认为,这一领域将来的发展非常有前景,特别是在家政服务、老人照护等方面。
主持人蒋涛:我记得吴翰清老师还提出一个观点,就是未来的这些AI会不会自己连接起来形成一个AI互联的社会?
吴翰清:计算机带来的一个重要的影响,就是产生了互联网。从发展演进看,计算机的体积从大到小,之后个人电脑开始出现,实现了人与人的连接,形成了今天的互联网。信息互联对经济的拉动作用是非常大的。可以说,过去十年全球GDP增长,主要来自互联网及相关产业。而这一次,以大模型为基础的AI带来的最大变化,就是我们每个人都拥有了AI计算机。以前,个人电脑不具备自主性,但今天在AI背景下,就具备了一定的自主性。而且,人与人之间的互联,在PC和移动时代,需要通过一些中间节点,如搜索引擎,找到彼此。过去用计算机去访问网站、访问APP,而现在计算机具备了自主性之后,AI就会自己找到彼此。从这一点出发,我们发现,AI会尝试找到一个更加直接、更加可靠的源头信息。这是互联网结构发生的一个重大变化,今天的很多信息不对称的问题,在未来AI互联的时代都会得到解决。这也意味着在经济学领域会发生一个翻天覆地的变化。
主持人蒋涛:因为是机器交易,而不是人在交易。
吴翰清:机器知道你的偏好,为你服务,会代替你永远在线。这彻底改变整个互联网结构。
主持人蒋涛:那请问王千祥老师,您怎么看待这个AI互联?
王千祥:对于AI互联,还得一分为二来看。尤其要关注,AI有自主性,其将来的智能水平很可能高于人类,那么,我们是否能理解它们之间的对话,我们会不会被它们边缘化。因为大模型本身具有一定不确定性,如果很多事情让它来决策的话,就会面临一定的风险。所以,要对大模型加以控制,正如作家兼教授阿西莫夫提出的“机器人三大法则”,也就是要给大模型打上思想钢印,使其一定要为人类服务,要与人类的价值观对齐,不能有任何偏离。目前,我们确实面临这个风险,也在讨论如何避免带着风险进入一个不确定的社会。
主持人蒋涛:我把这个话题再问一下孙富春教授,刚才说AI互联以后会比人还厉害,那它能做科学创新吗?
孙富春:我们发现,AI在某些方面是可以辅助科学家进行创新的。比如,美国曾做过一项研究,就是预测肺癌发生的可能性。他们收集了数千万份肺癌病例,并将这些病例确诊前三到五年的CT图像进行数据分析,找出肺癌确诊前期共性特征,而后从中精选了部分图像资料,研发了一个肺癌预测模型,准确程度甚至高于放射科的专家。可见,AI在单一任务、特定场景上的表现比人类更优秀。
刚才谈到一个问题,就是以智能网络为数字底座的分布式人工智能。它会通过构建一个协作式、去中心化的网络系统,最大限度地利用信息,实现群体智能。这是一个颠覆性的,它会完成更多难以完成的任务,包括做一些超出我们想象的事情。比如从不好的一面来看,它有可能会突破银行的防火墙,窃取各种重要数据。这就谈到一个非常重要的问题,就是在发展人工智能的同时还要注重治理,其中体现了人类价值的一致性。2017年1月17日,IBM首席执行官Ginni Rometty在世界经济论坛上提出了人工智能三原则:一是目的,人工智能的目的是帮助人、服务人、拓展人的能力,而不是取代人;二是透明度,人工智能一定是透明的,人类必须知道其算法是什么、学习数据是什么;三是技能,人工智能必须与行业内的人员合作,也就是人类要永远在一个安全回路中使用人工智能。
主持人蒋涛:这点可以做到吗?
孙富春:当然可以。而且,我们也必须做到,因为做不到的话,人工智能的发展就会失控。因此,我们要制定相关法律法规,确保人工智能系统在人类的怀抱里。
主持人蒋涛:最后一个问题,我们预测一下未来三到五年人工智能大模型的发展。吴翰清老师,您先来。
吴翰清:说一个与程序员相关的。我认为,未来三到五年一定会发生的事情,就是编程这项工作会被重塑,新型程序员会出现。他们只需要描述需求,剩下的由AI来实现。正如我之前说的“programming(编程)留给人类,coding(编码)留给AI”。也就是说,每个人都可以通过描述需求驱动AI来编程,未来三到五年,我们可以看到这个发展迹象。
主持人蒋涛:不会写程序的人,只要有编程思维,就可以在未来三到五年内驱动AI来写程序。孙富春教授,您预测一下呢。
孙富春:未来三到五年,一些行业有可能会被取代,比如教师就可能会被人工智能所取代。另外,在制造业中,大概20%的生产线会被机器取代。
主持人蒋涛:正如现在的一些“黑灯工厂”。袁媛老师,您来预测一下未来三到五年可能会发生的。
袁媛:未来三到五年,具身智能会进一步发展,不仅可以更好地与人交互,理解人的意图,而且还可以做更多的事情,比如做家务、护理老人。对此,我非常期待,希望能做第一批吃螃蟹的人,到时也一定要为家人、为自己买一台。
主持人蒋涛:王千祥老师,您来预测一下。
王千祥:未来三到五年,从软件研发的角度看,研发效率可以提升10倍。
主持人蒋涛:总的来讲,计算和AI会改变我们的未来。非常感谢四位嘉宾的分享。谢谢。