大家好,我是小巫幻想动作帮。今天三月初,一份疑似同OpenAI内部泄露的“核弹级”文件开始在互联网上疯传。文件来源于一个名为Vancouver1717的Twitter账户,该账户注册于2023年7月,只有两条推文:一条写着“2030年AGI将诞生”,另一条便是这份题为Q*(Q-Star)信息的PDF文件。文件开头的第一句话就非常震撼:说OpenAI将于2027年创造出相当于人类智慧的AGI。
所谓AGI是Artificial General Intelligence的缩写,即通用人工智能,或者叫做强人工智能。与目前已经普及的、主要用于完成某一特定任务的弱人工智能不同,AGI强人工智能能够执行通用任务,可以像人类一样思考和学习,具有自主意识和情感。多少人都认为AGI的出现将标志着科幻电影中AI全面接管人类工作和生活的场景成为现实。这份题为Q信息的文档声称,OpenAI早在2022年就开始训练一个具有125万亿个参数的多模态模型,该模型名为Q。OpenAI在2023年12月份完成了对Q*的初步训练,但由于算力成本过高,发布时间被一再推迟。
目前计划将于2027年发布使用Q*模型的GPT-8,届时该模型将全面实现AGI,智能程度相当于智商145的人类。这是一个什么样的概念呢?一般人的智商在85到115之间,人类智商的平均值大约是100;智商大约130就可以被视为是天才了,爱因斯坦的智商是160,而智商145的人工智能足以碾压绝大多数人类的智商。如果这份文件内容属实的话,那么AI留给人类的时间只剩下三年了。
虽然有不少网友质疑文件的真实性,但文件中提到的神秘项目Q其实早就在去年11月份就在网上广为流传了。去年11月份,OpenAI的CEO兼联合创始人之一的山姆·奥尔特曼曾经短暂被免职。就在山姆被免职的前一天,他曾在活动上发表了一些引人猜测的言论,比如:“这是我们创造的工具,还是我们创造的生物?这将是我们最大的更新。”很多人将其解读为OpenAI此时已经创造出了AGI。山姆被免职4天后,OpenAI的秘密人工智能模型Q就被泄露了出来。网络一度盛传山姆被免职的真正原因,可能是在Q*项目上和其他OpenAI的高层产生了意见分歧。这一系列爆炸性的新闻让人不禁好奇:AI究竟发展到哪种程度了?如果说我们之前讲过的元宇宙、Web 3还有一些噱头的成分的话,那么AI无疑是一场真正的技术革命。但凡对世界趋势有那么一丁点敏感度的人,都能意识到我们正处在一场百年一遇的大变局的节点上。有人说未来AGI将毁灭人类,也有人说目前人工智能还是渣渣,根本不足为据。今天我们就来深挖一下人工智能的过去和未来。视频比较长,希望大家可以耐心看到最后,因为最后我会结合各路专家的意见,剖析一下AI可能会给各行各业的人带来的影响,相信一定会对你今后的工作和生活带来帮助。
想要看清AI的未来,就一定要了解AI的过去,因为借镜历史才能预测未来嘛。而提到AI的诞生,绕不开的一个话题便是图灵测试了。1950年,第一台商用计算机还没有被造出来,但英国计算机科学家、数学家艾伦·图灵就在他的一篇题为《计算机与智能》的论文中提出了判断机器是否具有智慧的一套方法。这套方法诞生6年后,人工智能这个术语才被提出来。
图灵的一生既传奇又悲凉。二战时期,他曾经协助盟军破译德军密码,拯救了千万英国人的生命,但最终却因为同性恋饱受歧视走上绝路。关于图灵的故事,我之后会在会员视频中跟大家细聊,现在我们先回到图灵测试。图灵测试其实是一个思想实验,其具体内容是邀请一台机器A和一个正常人B参与实验,实验的评估员是人类C。C无法看到A和B,但是它可以询问二者一系列的问题。如果经过一番询问后,C无法辨别A与B的不同,则代表机器通过了图灵测试。图灵的观点是:如果我们无法区分机器和人类,那么我们就无法否认机器也在思考。接下来的事情可能连图灵本人都是没有想到的,图灵测试被提出四年后,图灵与世长辞,之后的数十年里,图灵测试演化为了衡量AI智能发展水平的重要标识,堪称AI界的北极星。
一代又一代的研究者乐此不疲地积极尝试,试图让自己发明的程序通过图灵测试。60年代美国计算机协会ACM还设立了图灵奖,专门奖励对计算机事业做出突出贡献的个人。1956年8月,美国达特茅斯学院数学系助理教授(后来1971年的图灵奖获得者)约翰·麦卡锡和信息论之父香农等人组织了一场长达两个月的研讨会。会议的主题在当时看来极其不食人间烟火,那就是:如何能让机器模仿人类学习以及其他方面的智能。会议召开的地点是在美国汉诺斯小镇宁静的达特茅斯学院中,因此这场会议也被称为达特茅斯会议。开会之前,为了拿到美国洛克菲勒基金会的赞助,麦卡锡等人不得不给会议主题想一个高大上的名字——Artificial Intelligence(人工智能)这个词应运而生。达特茅斯会议举行的年份1956年,后来也被很多人认为是AI元年。这场会议结束后的20年间,是AI发展的第一个黄金时期,各种学派和研究方向层出不穷,可谓是华山论剑、各显神通。
在AI诞生之初,由于对自身学科的定位非常模糊,很快就衍生出了很多不同的学派,比如符号主义学派、连接主义学派、行为主义学派、频率学派、贝叶斯学派等等。其中占主导位置的是符号、连接、行为三大学派。符号学派强调将知识化为符号和逻辑,初衷是把逻辑运算自动化;连接学派模拟人大脑神经元的连接机制,通过人工方式构造神经网络训练系统产生智能;行为学派则模拟人的行为,认为人工智能的产生是系统与环境交互的结果。80年代之前,符号主义学派力压群雄,被认为是第一代人工智能,而如今大行其道则是以深度学习为代表的连接主义学派。
下面我们就来展开讲讲这三大学派的江湖之争。符号主义学派的专家们认为,人类认知和思维的基本单元是符号,主张将人类所有的知识符号化,然后把包罗万象的符号组织起来,构建知识水晶球,形成如笛卡尔所言的人类思想字母表,这样就可以对所有未知问题进行推理形成答案了。例如在符号主义学派眼中,苹果这个物体可以用大小、颜色、种类、重量等符号来表达,符号之间用if-then语句来连接就形成了规则。举个简单的例子:if一个苹果的种类是红富士 AND 这个苹果是红色的,then这个苹果熟了。Every一种动物会飞 AND 这种动物有羽毛,then这种动物是鸟。另外,符号主义学派还非常擅长处理结构化数据,例如在1秒钟之内算出圆周率小数点后800位,花了医生时间才推算出了35位的德国科学家鲁道夫,如果能多活350年,一定会被吓得目瞪口呆。但符号主义学派AI遇到自然语言、图像、音频之类非结构化数据时就有点手足无措了。比如有这样两句话:A.四川火锅比日料更好,因为它很辣;B.四川火锅比日料更好,因为它不辣。问:四川火锅到底辣不辣?就这么一个问题,就足以把绝大多数符号主义AI系统给干趴下了。但是但凡一个有点中国文化背景的人,都能很容易地读懂:在A句中,“它”指的是四川火锅,而在B句中,“它”指的是日料,所以结论是四川火锅是辣的。而想要得出这个结论,不但要处理语义语境的问题,还要有一定的常识,这是符号主义学派AI很难做到的。
AI的连接主义学派恰好能够弥补符号主义学派在处理非结构化数据时的不足。有一种观点是,人类之所以能够称霸地球,是因为人类是所有动物中唯一具有抽象思维能力的。所谓的抽象思维,是把某种事物的重要特征提取出来,不重要的特征扔掉的过程。研究表明,人类大脑中含有500到1000亿个神经元,每个神经元有多达1万个突触,形成了庞大的互联网络,构成了思维和行为的基础。AI的连接主义学派又被称为仿生学派,主张模仿人类的神经元,用神经网络的连接机制来实现人工智能。这是一个简化了的神经网络算法的示意图,图中的每一个圆圈可以被当成人脑中的一个神经元,每一个神经元都有一个阈值,达到阈值,神经元就会被激活。我举一个极其通俗易懂的例子,就能够让你瞬间理解神经网络算法的工作原理:假如说我现在要去相亲,介绍人给我拿来了男嘉宾的资料X1、X2、X3、X4,分别代表着身高、颜值、收入和性格,是从男嘉宾身上提取出来的重要特征。如果男嘉宾的身高大于1米75且颜值比肩吴彦祖,那么神经元T1将被触发,我会进一步考量男嘉宾的过往恋爱史;如果男嘉宾的月收入过了1万且性格温和,那么神经元T2将被触发,我会进一步考量男嘉宾的居住地,看他跟我是不是异地;如果男嘉宾的收入没有过1万但是过了5千,且颜值还算过得去,那么神经元T3将被触发,我会进一步询问男嘉宾的家境。最后T1、T2、T3的值会汇总,我会得出结论这个男嘉宾值不值得一见。假设介绍人给我拿出来了1000份男嘉宾的资料,这个神经网络每看一份资料,就相当于被训练了一次。被训练1000次之后,它可能会比我更了解我心目中理想型男嘉宾究竟是什么样的人,这就是如今神经网络算法自我学习的过程。
当然了,连接主义学派发展初期的算法还远没有这么聪明。1957年,美国人工智能领域著名心理学家罗森布拉特在康奈尔航空实验室中,发明了史上第一台可以模仿人类感知能力的机器,罗森布拉特称之为感知器。不比如今复杂的多层神经网络算法,感知器是一种最简单形式的单层人工神经网络,可以进行二元线性分类。罗森布拉特用感知器成功识别出了多个英文字母,这在当时还是非常有轰动效应的。60年代初,美国国防高级研究计划局(DARPA)等政府机构曾向AI这一新兴领域注入了大笔资金,罗森布拉特也因为他的感知器从美国联邦政府那里拿到了不少钱。不过好景不长,1969年,符号主义学派代表人物、同时也是达特茅斯会议发起人之一的麻省理工学院教授马文·明斯基写了一本名为《感知器》的书,抨击了罗森布拉特的感知器——连异或问题都解决不了,还能干什么用?恰好那一年马文·明斯基就获得了图灵奖,在业界名声大噪,他的这本书直接把连接主义学派给写死了。
有人可能会好奇了,那么异或问题究竟是什么呢?异或问题的英文是exclusive OR,代码用XOR表示。A异或B的维恩图是这样的,代表着A或者B,但不包括A和B重叠的部分。是不是一头雾水?先别着急,换台,还是以我相亲的事件为例。假设现在有个男嘉宾小高,他的身高很高但颜值不行,我跟介绍人说我愿意去见见;还有个男嘉宾小帅,身高不行但是颜值还不错,我说我也愿意去见见。不过有个男嘉宾高帅,身高又高、长得又帅,我就跟介绍人说了:“这人我不见了。”介绍人一头雾水说为啥呀?我说,我觉得呀,这人又高又帅,他肯定看不上我,这去见也是浪费我的时间。还有一个男嘉宾黑蛋,身高不行、颜值也不行,我说这我也不见了,没什么亮点。所以大家可以看出来,我的择偶条件是:要么高,要么帅,但是你不能既高又帅,这就是异或问题。这里我用X轴表示颜值,用Y轴表示身高,把小高、小帅、高帅、黑蛋四个人都放在坐标里,是这个样子的。你会发现,如果我让你用一直线去给这四个人分组,不管怎么分,都不可能把符合我要求的和不符合我要求的完美分开。因为罗森布拉特的感知器只能解决二元线性分类,就相当于用一条直线来给四个人分组,这显然是实现不了的嘛。所以明斯基说,感知器屁用都没有。在这波符号主义学派和连接主义学派的PK当中,符号主义学派完胜,这也导致了接下来的十几年里,连接主义学派的成绩惨淡。
三大学派中还有一派是行为主义学派,也被称为是进化主义学派。这类学派的专家们主张,智能产生的过程就是感知外界环境并给出相应反应的过程。生物智能是自然进化的结果,生物通过与环境交互而发展出来越来越强的智能,人工智能也可以沿着“感知加行动”这个路径发展,即遇山开路、遇水搭桥,遇到了障碍物就躲开,遇到了垃圾就扫干净。这套路听起来是不是非常熟悉呢?没错,如今广泛应用的扫地机器人就是行为主义学派的研究成果。除了扫地机器人,工业生产中使用的机械臂也离不开行为主义学派的贡献。不过不管是扫地机器人还是机械臂,涉及的都是非常简单的机器与环境之间的交互,目前我们的技术还无法造出像人类一样具有极其丰富感知系统的智能机器人。
在1956年到1974年的第一个黄金发展期过后,AI的相关研究遭遇了两次寒冬。第一次寒冬的诱因是一篇题为《人工智能普查报告》的论文。AI这个概念诞生之初,很多专家和学者都对其抱有一些不切实际的幻想。比如1958年,美国计算机科学家、人工智能符号学派代表人物赫伯特·西蒙就曾经预言说:“再过十年,计算机就能问鼎国际象棋世界冠军。”但是要实现这个预言是需要强大的算力作为支撑的。在国际象棋里,每走一步可以有25到35种选择,我们取个中间值30吧。当然了我方每走一步,对方也会有25到35种不同的应对方法。那么如果机器想要走一步看10步的话,就需要计算第一步我方的30种走法乘以第一步对方的30种走法乘以第二步我方的30种走法……一直乘到第10步我方和对方的30种走法,也就是说需要进行30的20次方次的运算。六七十年代没有任何一台电脑可以承载这样的计算量,要知道当时登月的阿波罗11号的导航计算机的算力还不如今天的一部智能手机呢。
符号主义学派的发展需要算力,连接主义学派的发展不仅需要算力还需要海量的数字作为训练机来训练模型,行为主义学派的发展则需要能够支撑机器与环境交互的先进算法。算力、数据、算法是AI发展的三大要素,而在那个年代一个都不具备。不切实际的研发目标带来的是接二连三的项目失败,期望落空。有人甚至打了这样一个比方来讽刺六七十年代AI领域的研究成果:说人类想要登上月球就造了一个梯子,然后用这个梯子爬上了一棵树,之后就自豪地宣布称,现在我们已经向月球迈进了一大步。1973年,英国应用数学家莱特希尔爵士发表了一篇题为《人工智能普查报告》的论文,表达了对大量投资未能产生预期收益的失望,结论是不应该再往AI这个无底洞里面继续砸钱了。此后AI领域的研究经费锐减,AI研究迎来了第一个六年寒冬。直到1980年,卡内基梅隆大学为美国电脑公司DEC开发了XCON订单专家系统,AI的研究才打破寒冬,进入了第二个高速发展期。
专家系统可以被认为是符号主义学派的进一步发展,该系统一般有两个部分组成:知识库与推理引擎。知识库是一群专家提供的某一领域的专业知识和经验,而推理引擎则可以模拟专家的思维过程,从而做出推理和判断,提出解决问题的方案。以XCON订单专家系统为例,当客户订购DEC公司的计算机时,XCON可以按照客户需求自动配置零部件,在投入使用的6年间共处理了8万个订单,准确率高达95%,为DEC公司节省了4000万美金的资金。1980年到1987年间,人工智能领域的研究几乎都是围绕专家系统展开的。但专家系统也是有它的弊端的,它的适用值仅限于某些比较特定的领域,而且知识采集难度大,运维费用也很高。在基于规则的专家系统当中,知识是用一组规则来表达的。为了构建专家系统,程序员需要和人类专家坐下来共同探讨哪些规则适用、哪些不适用。比如有一条规则是“鸟会飞”,还有一条规则是“企鹅是鸟”,那么专家系统很有可能会得出一个推理结论:企鹅会飞。但显然这是有违常识的,我们还要在知识库中再录入一条规则:鸟会飞,但是企鹅除外。在那个年代,所有的规则录入都依赖人工,机器无法做到自主学习规则,这就让专家系统的运维成本提高了。80年代末万维网的诞生也大大提高了知识获取的便利性。不久后,人们对专家系统的狂热追捧就又转变成为巨大的失望,人工智能的发展陷入了第二次低谷。
但是仍然有一批科学家在热爱和强烈的科学责任感的驱使下,选择留在了这一领域深耕。时间转眼来到了1997年5月11日,这天由IBM开发的国际象棋超级计算机“深蓝”以两胜一负三平的成绩战胜了国际象棋世界冠军加里·卡斯帕罗夫,成为了第一台击败世界冠军的电脑。赫伯特·西蒙曾经的预言成真了,虽然这个预言晚实现了29年。此事件标志着一直持续至今的AI研究热潮的复苏。而深蓝能够成功击败人类,最大的功臣应该是计算机算力的提升了。深蓝的基础算法就是我们刚才所讲解的暴力穷举法,即依靠强大的算力穷举并评估所有路数来选择最佳策略。深蓝靠硬算可以预判12步,每一秒可以完成2亿步棋的计算,而当时的世界冠军卡斯帕罗夫凭经验只能预判10步。
在深蓝出圈的同年,北卡罗来纳大学的物理学家马克·古布鲁德首次提出了AGI这个概念。AGI的直译是通用人工智能,有时也被称为是强人工智能或者超级人工智能,与其相对应的是弱人工智能。专家系统、深蓝以及后来的AlphaGo,甚至是一如如今的ChatGPT都属于是弱人工智能。他们只能在某一特定领域完成某种特定任务,例如配置零部件、下象棋、下围棋、翻译等等。而AGI正如其名字,可以在广泛的环境中像人类一样表现出高度的灵活性和智慧。
深蓝的出圈为AI的符号主义学派争了一口气,但与此同时,连接主义学派也在悄悄地崛起。这里就不得不提到一个人物了:深度学习之父杰弗里·辛顿。1978年,辛顿在英国爱丁堡大学获得了人工智能博士学位,彼时人工智能领域大行其道的是还是符号主义学派,但是辛顿主打的就是一个不随波逐流。他认为符号主义学派太过僵化,太过依赖于已知的规则,自然界中很多动物是说不出那一套一套的规则的,但依然能够表现出智慧行为,这是因为他们能从经验中学习如何变得聪明,所以辛顿认为:智慧来源于学习能力,而非规则。几十年间,辛顿发表了200多篇论文,凭一己之力开创了深度学习的时代,也成功扭转了连接主义学派的败局。
辛顿的出发点其实非常的简单,就是“多则不同”,只要把多个感知器连接成一个分层的网络,就能够圆满地解决明斯基的问题了。这是刚才我们讲过的神经网络算法的示意图,多层神经网络装备上反向传播算法这个外挂之后,就可以解决很多复杂的识别和预测问题。2012年,辛顿带领他的团队参加了第三届ImageNet视觉识别挑战赛,他们凭借着全新的深度卷积神经网络AlexNet以压倒性的优势夺得了冠军。至于卷积神经网络是什么,这里就不展开说了,否则大家真的要换台了,你只需要知道它是物体检测和图像识别的利器就可以了。
进入到21世纪之后,随着互联网大数据的产生和计算机算力的进步提高,各种不同的深度学习算法被先后提出,有的用于语音识别、自然语言处理,有的用于图像生成,AI的连接主义学派开始声名大噪、异军突起。2016年3月15日,谷歌开发的围棋人工智能AlphaGo与韩国九段棋手李世石对弈并以4比1的成绩获胜,这场人机大战成为了人工智能史上一个新的里程碑。有人说之前的深蓝其实胜在算力,而AlphaGo才是真正的人工智能的胜利。其实从惊人的角度来看,深蓝还算不上是智能的,深蓝的算法依旧停留在穷举加搜索最优解的阶段。而国际象棋和围棋在复杂程度上不可同日而语,围棋的变数极多,每一步都有250种可选的下法,而一盘棋可以长达150步,深蓝式的硬算在围棋上显然是行不通的。AlphaGo的胜利更依赖于其精妙的算法。AlphaGo是强化学习和深度学习结合的产物,这也是三大学派的一次联手:符号主义学派输入了围棋规则和棋谱,连接主义学派提供了深度学习的模型,用海量人类围棋比赛的数据来训练AlphaGo,而强化学习算法则来源于行为主义学派,它通过让训练对象不停地和环境进行交互并给予训练对象相应的奖励,使训练对象学会趋利避害,进而做出最优决策。中国棋手柯洁曾这样评价AlphaGo:“感觉就像是一个有血有肉的人在下棋一样,该弃的地方也会弃,该退出的地方也会退出,非常均衡的一个棋风,真是看不出来是出自程序之手。”
2017年,AlphaGo进一步升级为新版程序AlphaGo Zero,Zero可以完全不依赖任何人类围棋比赛的数据作为训练数据,在只知道比赛规则的情况下自我对弈,经过几天的训练之后,就能够以100比0的成绩击败老前辈AlphaGo。从深蓝到AlphaGo,是人工智能从“算”到“学”的一大进步,经过了半个多世纪的发展,人工智能似乎终于走上了正确的道路,而这一切才刚刚开始。
2023年,福克斯新闻联系辛顿,希望就人工智能的话题对辛顿进行采访。辛顿喜欢在邮件中使用一些尖刻的黑色幽默,在邮件的结尾处,他说道:“福克斯新闻就是一个Oxymoron。”Oxymoron连在一起是矛盾修辞法的意思,分开写就成为了“敏锐的白痴”。邮件发出后,辛顿灵机一动,在ChatGPT中输入了这句话,他问ChatGPT是否能够理解他的笑话。结果GPT告诉辛顿,他的句子暗示着福克斯新闻都是假新闻,但是福克斯新闻也像奥施康定一样让人上瘾。奥施康定是美国的止痛药,曾经让很多美国人在不知情的情况下染上了毒瘾。GPT这样的回答代表它不仅理解了辛顿的笑话,而且还回抛给辛顿了一个奥施康定的梗。辛顿意识到,人工智能的一个新时代已经到来了。
2022年11月,位于美国旧金山的人工智能研究公司OpenAI推出了全新对话式AI模型ChatGPT-3.5,上线不到一周的时间就突破了100万的用户,上线两个月后已经拥有上亿用户,成为了史上用户增长速度最快的应用程序。ChatGPT发布后,OpenAI的估值已经飙升至800亿美金,而投资OpenAI的微软不仅获得了丰厚的投资回报,股价更是一路高歌猛进,终于在老竞争对手谷歌面前硬气了一回。这还没完,2023年3月12日ChatGPT-4正式上线,带来了图像输入功能,给他一堆食材的照片,他可以迅速告诉你用这些食材可以做出什么样的食物。输出量上也有了显著的提升,一次输出可以达到25000个单词,胡编乱造的答案也明显少了许多,遇到伦理和敏感问题时给出的答案也更加安全。
3月27日,OpenAI发布了GPT-4的技术报告,报告中的很多数据让人脊背发凉。测试显示,相比GPT-3.5,GPT-4的智能程度有了质的飞跃,在美国生物奥赛和GRE Verbal考试中能够击败99%的参赛学生,在律师资格考试中也能够战胜90%的人类。最恐怖的是,就像辛顿感受到的那样,GPT-4已经能够理解人类的笑点了。比如这张图,GPT-4能够清楚地说出图中的幽默是:将一个过时的VGA连接线插入了一个小型现代智能手机的充电接口。技术报告的最后,OpenAI团队总结说道:“GPT-4及其后续模型无疑将以有意和有害的两种形式给人类社会带来巨大的影响。”其中“有害”一词显得格外意味深长。要直到就在这份技术报告发布的一周前,生命未来研究所写了一封题为《暂停大型人工智能研究》的公开信,呼吁所有AI实验室立即暂停训练比GPT-4更强大的人工智能系统,至少6个月,并利用这6个月的时间制定监督和规范AI发展的安全协议。截止到我写这篇文案时,已经有将近3万4千人在在这封公开信上签名了,其中包括首富埃隆·马斯克、苹果联合创始人史蒂夫·沃兹尼亚克、深度学习之父杰弗里·辛顿、Stability AI创始人艾马德等数千名科技界的领导人和专家学者。值得一提的是,有网友发现OpenAI的CEO山姆的名字也曾经短暂地出现在公开信的签名处,但不久后就神秘消失了。
生命未来研究所在信中接着问道:我们是否应该把所有的工作都自动化,包括那些有成就感的工作?我们是否应该开发机器大脑,让他们比人脑还多、比人脑还聪明,最终淘汰我们、取代我们?我们是否应该冒文明失控的风险去开发AI?2023年5月1日,在谷歌工作了十余年的深度学习之父杰弗里·辛顿宣布从谷歌辞职。起初有人猜测是谷歌的内部管理出现了问题,但后来辛顿在一次采访中提到,他离职的真正原因是:他想要自由地讨论AI的潜在风险。他表示说:“我对我毕生所研究的东西感到后悔了。”随后《纽约时报》更是以《当AI教父开始恐惧他的造物》为题,写了一篇关于辛顿的人物传记。当人工智能开创者摇身一变成了AI末日论的吹哨人,是否代表着人工智能产业的发展已经失速了呢?众所周知,首富埃隆·马斯克也曾经不止一次地警告过AI的危险性。他在纪录片《你信任这台电脑吗》中说:“如果AI想要实现一个目标,恰好人类就挡在这条路上,那么AI会毫不客气地灭了人类,并不是因为AI对人类抱有什么邪恶的感情,只是因为人类恰好就在这条路上。就像我们要修一条路,而这条路上有一个蚂蚁窝一样,我们并不讨厌蚂蚁,但对不起了,拜拜了蚂蚁。”
我想诸如马斯克以及辛顿这样的大佬惧怕的并不是ChatGPT这一款AI产品或者是OpenAI这一家公司,他们惧怕的是这场正在如火如荼进行的AI竞赛会把人类带上一条不归路。毕竟过去的这一年可谓是AI研究领域神仙打架的一年。2023年1月,谷歌推出MusicLM模型,这是一种能从文本描述中生成高保真音乐的模型;2月微软发布ChatGPT版搜索引擎New Bing;3月百度推出大语言模型文心一言,在理解中文和中国文化上有很好的表现。几乎是在同一时间,AI图像生成领域的佼佼者MidJourney发布了他们的第五代模型,由它生成的一张中国情侣的图片因效果酷似真人而火爆出圈。第五代模型处理人物细节的能力得到了明显的提升,之前的机型“手部漂浮”、“四肢扭曲”的问题都得到了解决。9月,Stability AI推出音乐生成器Stable Audio,和MusicLM一样,可以基于文本描述自动生成音乐。今年2月,OpenAI又重磅推出了视频生成模型Sora,一句文本描述即可生成一段高清视频。显然生命未来研究所的那封公开信没能让各大科技公司停下脚步,我也不认为这AI竞赛在未来有减速的可能。就像当年美苏争霸创造了登月奇迹一样,这场AI竞赛是会创造奇迹还是怪物,谁都无法给出一个准确的答案,而我们普通人能做的就是全副武装、拥抱未来。
2023年3月,OpenAI发布了一篇AI对劳动力市场潜在影响的早期观察报告,报告指出80%的美国劳动力市场会受到轻度的影响,19%的美国劳动力市场会受到重度的影响,这19%的工作岗位中至少有50%的工作任务会被AI取代。受影响最大的职业包括翻译工作、作家、记者、数学家、财务工作者、区块链工程师等等。视觉中国的一篇报道指出,目前最不容易被AI取代的岗位是那些需要面对面互动或者是精准肢体技能的岗位,例如泥水匠、电工、美发师、医生和护士等等。但我个人认为这些职业能坚挺多久实在是不好说,毕竟机器人领域的发展也是非常迅速的。计算机科学研究者、创新工场CEO李开复认为:在未来,需要创意性、社交能力、协商能力的工作是最不容易被取代的;而无须天赋,经过短暂训练即可快速上岗的职位,以及涉及大量重复性劳动的职位,是最容易被取代的。通过AI发展的这70年,可以说是道阻且长的70年,有高速发展期也有低谷期,三大学派也是各领风骚数十年。
回到视频开头提到的Q*项目和图灵实验,有人可能好奇:ChatGPT现在已经这么聪明了,那么它通过图灵测试了吗?刚才讲解图灵测试的时候,我其实省略了一个细节,那就是评估员C是一群人,而不是一个人。测试结果的评判也是有标准的,每个评估员C都会提出来一大堆问题,如果机器A能让平均每个评估员做出超过30%的误判,那么就算机器A通过了测试。2023年10月,美国圣地亚哥加利福尼亚大学的两名研究员进行了一场关于ChatGPT是否能够通过图灵测试的研究,研究结果显示GPT-3.5的得分是14%,也就是平均让每个评估员做出了14%的误判;GPT-4的得分是41%,按照30%的标准,GPT-4算是通过了图灵测试。有意思的是,真人在测试中的得分也不是满分,是63%。不过值得指出的一点是,一直以来图灵测试都是比较有争议的,因为图灵测试只侧重于语言上的互动,而大型语言模型就是为模仿人类交流而生的。即使GPT通过了图灵测试,我们就能说GPT拥有了自我意识,是强人工智能AGI了吗?答案显然是否定的。在是否拥有自我意识这个问题上,GPT自己也很诚实。不过这些都不是重点,重点是我们今天正站在一个新时代的起点上。
如今的AI大模型无疑还有很多不足之处,但那又怎么样呢?谁会要求一个刚刚学会算术的孩子就看得懂微积分方程呢?重要的是它已经做好了持续学习的准备。牛顿时代的物理学架构也不完美,是后来爱因斯坦、麦克斯韦、波尔、狄拉克等人不断地对其补充才有了今天物理学界令人眼花缭乱的成就。Q*项目是否会在2027年造出强人工智能AGI,谁也不知道,但无疑的一点是:在人工智能发展的下一个70年里,必将会涌现出来更多更炸裂的操作。有不少人因为近期AI产业的高速发展而感到焦虑,但我认为有时候焦虑其实也是一件好事,因为它会倒逼我们重新认识自己。就像复旦大学计算机系教授肖仰华所说的那样:“我们从来没有像今天一样,可以在镜子里看到一个跟我们长得一模一样的智能体,那就是新的人工智能。”重新认识我们自己,在人工智能时代是尤为迫切的。还记得标志着AI元年的达特茅斯会议的主题吗?“如何能让机器模仿人类学习以及其他方面的智能。”AI产生智慧并不可怕,可怕的是因为AI的出现,人类从此丧失了思考和持续学习的能力。好了,今天就到这里,我们下期节目见,拜拜。