新闻资讯

基辛格生前最后一本书:人类要如何与人工智能共存?

【编者按】“如果被迫与机器妥协,我们的底线是什么?”外交家亨利·基辛格在其生前最后一本书《人工智能时代与人类价值》中,与两位合作者——谷歌前CEO埃里克·施密特及微软前首席研究和战略官克雷格·蒙迪,从高度战略性的角度对这一问题进行了审视。他们预见,随着时间推移,人工智能“将对历史、宇宙、人类本质以及智能机器的本质得出结论,并在这一过程中形成初步的自我意识”,进而变成“类人人工智能”。如何与之共存?两个“对齐问题”需要解决:一是人类价值观和意图与人工智能行动在技术层面的对齐,二是人与人之间在外交层面的对齐。本文摘自该书第八章第二小节《共存:类人人工智能》,已获出版社授权。

迈达斯国王——历史上小亚细亚王国的君主——曾许下一个著名的愿望,希望他所接触的一切都能变成黄金。希腊的酒神和享乐之神狄俄尼索斯满足了迈达斯的这个愿望,尽管他知道这个愿望并不会带来什么好事。不久,由于触碰到的佳肴和美酒都变成金子无法享用,迈达斯被迫在帕克托洛斯河中洗手,以摆脱他那被诅咒的手指。

在由迪士尼重述的叙利亚故事《阿拉丁》中,一个童工和一个有权有势的阿格拉巴王朝国师争夺对一盏神灯中无所不能的精灵的控制权。每个人都努力引导精灵实现自己的愿望。国师的最后一个愿望是让自己变得和精灵一样强大,但他没有意识到,拥有如此强大的力量意味着他也将被囚禁在神灯里,服侍其他人类主人,直到获得自由的那一天。

这两个故事都讲述了解封和运用一种我们凡人所无法理解或掌控的力量有多么困难。这场古老斗争在现代的寓意是,很难让人工智能与人类的价值观相一致,也很难让人类的期望与现实相一致。我们应该假定,人工智能会让我们大吃一惊,并且随着智能体或“规划型”人工智能的发展,它们在动态世界和数字世界中让我们为之惊讶的能力也会提升。如前文所述,未来几代人工智能将能够感知现实;它们可能不仅具有自我意识,还拥有自我利益。一个自利的人工智能可能会认为自己在与人类竞争一些东西,比如数字资源。在“递归自我完善”的过程中,一些人工智能可能会发展出设置自身目标函数的能力。人工智能可以操纵和颠覆人类,挫败我们限制其力量的任何尝试。人工智能已经能够欺骗人类,以实现自己的目标。

如今,我们几乎没有独立能力来验证人工智能模型的内部运作,更不用说它们的意图了。如果智能机器仍然像埃利泽·尤德科夫斯基所说的那样,是“巨大而不可捉摸的小数阵列”,那么随着它们变得越来越强大,我们也无法指望它们对我们来说是安全的。因此,最重要的是,我们在学会如何解读智能机器的同时,也要学会如何确保它们对我们安全,这两项使命要双管齐下。

鉴于人工智能目前展现的令人惊讶的能力,我们将如何设法未雨绸缪,而不仅仅是在人工智能的风险来临时兵来将挡?我们需要怎样的远见和效率预见未来发展的全部倾向和一系列可能采取的行动?要知道这不仅关乎我们自己的物种,还事关一个全新物种。我们不能在只有一次试验机会且容错率为零的情况下奉行试错策略。

要让人工智能不那么引人惊骇,加强人们对它的体验、参与和互动也许是无可替代的办法。早期的人工智能开发者曾担心过早地将人工智能暴露在世人面前,而最近的开发者则一直在释放早期模型,允许更多的公众尽可能快速、安全地对其进行试验。工程团队目前正在研究和微调不同的模型,并调整控制系统,而人工智能与全球范围内人口的互动也暴露出了新的担忧。

对人工智能的早期社会化可以通过对其进一步的教育来降低出现问题行为的风险,同时在人类之中,也可以提高对此的意识水平、应对力,并培养一种健康的怀疑精神。每天数以百万计的人机互动有助于测试人工智能可能遇到的最不可能的情况;反过来,公众对人工智能系统的使用,在发现新错误和新风险的同时,也可能有助于加快技术协调一致化的进度。因此,将这些远非完美的人工智能放任于世间,不仅有助于我们适应它们,更重要的是,它们的出现使得我们能够提出更完善的理论,以使它们适应我们。

不过,广泛部署和公开发布可能还不足以揭示与解决当今人工智能的所有风险,更不用说未来的风险了。

但值得庆幸的是,目前人们正在进行大量尝试,以创建一个集成的控制架构,并将其通过预训练注入最强大的人工智能,从而积极引导机器实现合法、无害和有益的用途。

迄今为止,实现这种人工智能与人类协调一致的 *** 大致分为两类:基于规则的系统和从人类反馈中“强化学习”。下面让我们逐一介绍。

基于规则的系统类似于预先编程的指令,是程序员管理人工智能行为的一种尝试。虽然这种 *** 对于简单的任务来说直截了当,但在复杂的场景中却经常会出现问题,因为系统无法进行实时适应。而强化学习就其本身而言则更适合复杂系统,它允许人工智能从与人类评估者的交互中学习,并灵活地适应特定环境。

当然,这种 *** 也有它的缺陷。为了指导学习,需要精心设计“奖励函数”;任何失误,无论是由于目光短浅、不可预见的情况,还是由于人工智能聪明过人,都可能导致“奖励黑客”的情况,即人工智能在解释模棱两可的指令时,虽在技术上取得了高分,却没有达到人类的实际期望。

今天的人工智能系统被灌输了各种类型的信息,却没有直接体验现实世界,而是通过由数万亿个概率判断组合而成的现实模型来观察这个世界。对它们来说,在这个宇宙中,从一开始就没有“规则”,也没有任何 *** 来区分科学事实和未经证实的观察。对人工智能来说,一切——甚至是物理定律——都仅仅存在于相对真理的范围之内。

不过,现在人工智能领域已经开始努力纳入人类规则和实例化事实。现在,人工智能模型已经有了一些成熟的机制,通过这些机制,这些模型可以吸收某些实在性的“基本真实”常量,将其标记为最终常量,并将其映射到自己的嵌入空间中。此外,这些信息还可以很容易地进行全局更新。通过这种 *** ,人工智能模型就能将两个部分——更广泛的概率判断和更狭义的事实真相评估——融合在一起,从而做出合理准确的反应。

但这项任务还远远没有结束,问题仍层出不穷。比如,我们人类该如何为人工智能区分真理的必要属性,并在此过程中为我们自己也做一番区分?毕竟,在人工智能时代,即使是基本原理也会不断被修正和失效。然而,恰恰是这一点,为我们提供了纠正先前错误并开辟新天地的机会。我们知道,我们对现实的概念也可能发生变化,因此,我们不应该把人工智能禁锢在可能错误的“真理”中,这样会阻碍它们重新考虑自己的终极“真理”。

不过,这已是很久之后的事情了。目前,人工智能仍然需要一棵初级的确定的知识树,这些知识代表人类迄今为止推断出的“真理”。让我们的机器拥有这些知识,将使我们能够可靠地强化它们的世界观。特别是,如果我们现在可以根据宇宙法则来调整早期的人工智能系统,那么我们也有可能参照人类天性的法则来依葫芦画瓢。既然我们可以确保人工智能模型以我们所理解的物理定律为出发点,同样,我们也应该防止人工智能模型违反任何人类政体的法律。

在一个人工智能的“法典”中,可能存在不同治理级别的层次:地方、地区、州、联邦、国际。法律先例、法理、学术评论——或许还有其他不太偏重法律的著作——可以同时被人工智能纳入考量。与基于规则的一致化系统一样,预定义的法律和行为准则可以成为有用的约束,尽管它们往往也不那么灵活,设计时考虑的范围也不如实际的人类行为不可避免地要求的那样广泛。

幸运的是,新技术正在接受考验,我们感到乐观的原因之一,在于一些非常新颖,同时又非常古老的事物的存在。

有种东西比任何通过惩罚强制执行的规则更有力、更一致,那便是我们更基本、更本能、更普遍的人类理解。法国社会学家皮埃尔·布迪厄将这些基础称为“共识”(doxa,古希腊语,意为普遍接受的信仰):这是规范、制度、激励机制和奖惩机制的重叠 *** ,当它们结合在一起时,就会潜移默化地教导人们如何区分善与恶、对与错。共识构成了人类真理的准则,它是人类的典型特征,但没有人工制品对其加以固化呈现。它只是在人类生活中被观察到,并被纳入生活本身。虽然其中一些真理可能是某些社会或文化所特有的,但不同社会在这一方面的重叠性也是很大的;数十亿计的人类,来自不同的文化,有着不同的兴趣爱好,他们作为一个普遍稳定且高度互联的系统而存在。

在书面规则无法平息混乱的情况下,未加定义的文化基础却可以做到,这一观点构成了人工智能领域一些最新 *** 的基石。“共识”的法典无法表述,更无法翻译成机器可以理解的格式。必须教会机器自己完成这项工作——迫使它们从观察中建立起对人类做什么和不做什么的原生理解,吸收它们所看到的一切,并相应地更新它们的内部治理。

在这一灌输“共识”的技术过程中,我们不需要,甚至不希望就人类道德和文化的正确表述达成先验一致。如果大语言模型能够以未经整理的方式吸收整个互联网的内容,并从中找出尽可能多的意义(正如它们已经做到的那样),那么机器——尤其是那些已经发展出接地性(也就是反映人类现实的输入与大语言模型输出之间的可靠关系)和因果推理能力的机器——在吸收连我们自己都一直难以明确表达的内容时,或许也能达到同样的效果。

当然,机器的训练不应只包括“共识”。相反,人工智能可能会吸收一整套层层递进的金字塔级联规则:从国际协议到国家法律,再到地 *** 律和社区规范等。在任何特定情况下,人工智能都会参考其层级中的每一层,从人类定义的抽象戒律转化到人工智能为自己创造的,对世界信息的具体却无定形的认知。只有当人工智能穷尽了整个程序,却找不到任何一层法律能充分适用于指导、支持或禁止某种行为时,它才会参考自己从观察到的人类行为的早期互动和模仿中得出的结论。这样,即使在不存在成文法律或规范的情况下,它也能按照人类的价值观行事。

几乎可以肯定的是,要建立并确保这套规则和价值观的实施,我们必须依靠人工智能本身。迄今为止,人类还无法全面阐述和商定我们自己的规则。而且,面对人工智能系统很快便有能力做出的数以十亿计的内部和外部判断,没有任何一个人或一组人能够达到对此加以监督所需的规模和速度。

最终的协调机制必须在几个方面做到尽善尽美。首先,这些保障措施不能被移除或以其他方式规避。其次,在控制上必须允许适用规则的可变性,这种可变性基于环境、地理位置和用户的个人情况而定,例如,一套特定的社会或宗教习俗和规范。控制系统必须足够强大,能够实时处理大量的问题和应用;也要足够全面,能够在全球范围内,在各种可以想见的情况下,以权威且可接受的方式进行处理;并且足够灵活,能够随着时间的推移进行学习、再学习和调整。最后,对于机器的不良行为,无论是由于意外失误、意想不到的系统交互,还是有意滥用,都不仅要禁止,而且要完全防患于未然。无论何种事后惩罚都只会是为时晚矣。

作者:亨利·基辛格(Henry Kissinger)  埃里克·施密特(Eric Schmidt) 
克雷格·蒙迪(Craig Mundie)
译者:胡利平 风君
出版品牌:中信出版·方舟工作室

(文章仅代表作者观点。)

  • 耿爽:我们比以往任何时候都更需要多边主义
  • 114城1133个“旅游度假酒店最优解”,2025年大众点评“必住榜”正式发榜
  • 秦洪看盘|浮现新预期,存量资金积极调仓
  • 美图公司午前涨近3% 中金维持“跑赢行业”评级
  • 赵依芳:网络文学、网络影视内容、网游是中国文化出海新三样
  • 易鑫宣布年内推出汽车金融行业首个Agentic大模型
  • 经济日报:美离间国际关系注定徒劳无功
  • 几百元的工资优势已不能吸引人才流动,江苏多地探讨“抢人”高招
  • 股票型ETF资金流入显著
  • 抖音:将投入专项流量激励知识类内容
  • 专访|松重丰:“美食家”不孤独,他在自由地吃饭
  • 探索未来课堂更多可能,“人工智能课堂分析循证实验室”在沪成立
  • 谷歌寻求与苹果达成Gemini AI合作协议 或于年中敲定
  • 中国社会科学院大学:停止焦某某一切工作,启动调查
  • 2025五一档首日电影票房破亿
  • 布局中国市场步伐未停止!外资巨头做多A股
  • 2万美元的电动皮卡!贝索斯押注的初创车企连音响都给砍了
  • 对峙10小时,韩警方搜查总统府及官邸再次宣告失败
  • 界面晚报 | 中共中央、国务院发文实施自贸区提升战略;超1230名经济学家警告美国自残式衰退
  • 俄罗斯与乌克兰互换246名在押人员
  • 命运与共好伙伴|携手谱写柬中命运共同体新篇章
  • 即便贸易问题得到解决,欧洲央行仍因经济受损准备在6月降息
  • 五问极端大风:为何一夜之间迅速南下?未来还将持续多久?
  • 一季度“淡季不淡”,这几大因素让上海集成电路产业快速增长
  • 【评论】2025年政策路线图明晰:全方位扩大内需
  • 兵韬志略|美菲“肩并肩”军演超越传统范畴,凸显防务合作重大转型
  • 视频丨A股2024年年报披露收官 四分之三公司盈利
  • 抖音:将投入专项流量激励知识类内容
  • 中国贸促会:有近50%的外贸企业表示将减少对美业务
  • 深化人身险营销体制改革重磅落地!行业不止向“专业”看齐
  • 特朗普启动审查程序 拟对芯片和药品进口加征关税
  • 苏迪曼杯即将在厦门打响,国羽向创纪录的14冠进军
  • 关税下Temu美区“急转弯”,力推新模式承接流量
  • 农发行发行首只支持国家储备林建设主题绿色债券
  • 东证资管总经理张锋离任,东方红品牌昔日荣光不在
  • 好评中国丨从茶烟袅袅中窥见文明脉络
  • 财报发布进入倒计时 特斯拉平价电动汽车和机器人出租车成关注焦点
  • 卓越教育集团:2024年收入和净利润均翻倍增长,素质教育收入增长4倍
  • 新城市志|中国消费第一城,迎来“补贴力度最大”购物节
  • 发技能提升补贴、失业保险返还,这些稳岗惠民政策将延续
  • 全国首例上市公司董监高违反公开承诺案宣判,两人一审被判共同赔偿约78万元
  • 中国海警登临铁线礁开展维权行动并展示五星红旗
  • 三星电子第一季度芯片业务利润大降 受美国出口管制和价格下跌影响
  • 现货黄金跌超0.8%,脱离历史最高位,纽约铜涨超2.2%
  • 一片质疑声中,美股九连涨,收复“对等关税”以来所有跌幅
  • 一件外套7000元,这个“淘品牌”把店开到上海南京西路
  • 周三热门中概股涨跌不一 台积电涨1.34%,蔚来跌4.48%
  • 沪指止步8连涨,银行、地产包揽单周涨幅TOP2,这只ETF逆市创新高
  • 印度突袭检查亚马逊与Flipkart仓库 宣称发现大量违规商品
  • 五一假期前两日,多地党政主官暗访景点、商圈安全工作
  • GPT-4.5功臣遭驱逐!奥特曼盛赞工作出色,美国深陷AI人才危机
  • 格力电器:将继续加大对侵权行为的打击力度,有5人被判处有期徒刑
  • 南京信息工程大学商学院讲师李玮玮逝世,终年45岁
  • 两岸学生在京共赴青春之约
  • 抢装红利下,逆变器龙头阳光电源一季度净利上涨八成多
  • 3月个人住房新发放贷款加权平均利率约3.1%,同比降约60个基点
  • 中方决定对在涉港问题上表现恶劣的美国国会议员等实施制裁
  • 瑞典品牌Craft入华来势汹汹,一次进入两大地标商场
  • 东方甄选盘中涨超9% 公司启动“外贸优品入驻”专项行动
  • 统计局回应美“对等关税”对GDP影响:改变不了中国经济向好大势
  • Pimco:特朗普关税“自找”供给侧冲击 美国市场恐重演英国脱欧式动荡
  • 大风+强对流+暴雪+沙尘暴,中央气象台今晨四预警齐发
  • 推动中阿合作“向新而行”,这场论坛在上海松江举行
  • 特朗普考虑对进口汽车和零部件设置25%关税豁免条款
  • 孩之宝预警:特朗普关税将使今年利润缩水3亿美元
  • 关税风暴下的芯片业:部分订单已停止报价
  • 金地集团:保交楼为经营的首要任务,将根据融资性现金流恢复程度等进行投资决策
  • 保时捷考虑在华停售电动汽车,CEO称未将小米当对手
  • 关闭非洲使馆、降低加拿大重要性?美国国务院被曝将大改组
  • 停牌一年多,“水果第一股”传利空!涉嫌骗取贷款等事项,多位高管被立案侦查
  • 国货“稳稳鞋”泰兰尼斯杀入香港顶级奢侈品商场
  • 长期股票投资试点加快落地 更多险企积极推动资格申请
  • 首季度利润翻超10倍,中船防务2025年迎来估值“春天”?
  • 谷歌分拆案审判正演变为一场关乎人工智能未来的较量
  • 界面晚报 | 中方对美所有进口商品加征125%关税;合肥等9城加入服务业扩大开放试点
  • 广交会为世界经贸注入稳定预期
  • 习近平给谢依特小学戍边支教西部计划志愿者服务队队员的回信
  • 钢琴卖不动了?珠江钢琴与海伦钢琴利润三位数暴跌
  • 俄乌“暂停打击”协议到期 ,冲突要升级?梅德韦杰夫最新发声:美国“明智”,欧洲也应该这么做......
  • 不堪电商百亿补贴冲击?古越龙山叫停部分高端产品线上销售,公司回应:是为进一步规范价格
  • 一汽奔腾启动新一轮增资引战
  • 抑郁深渊里的孩子,和捞起他们的一双手
  • 广西河池持续旱情影响7万亩农田 多部门紧急送水保民生
  • 韩文秀:三大风险已得到有效控制
  • 国家一级运动员复查出疑似肿瘤!经历3次开颅手术,曾因颜值实力兼具成为学校风云人物
  • 特朗普:泽连斯基的言论对和平谈判非常有害
  • 辰林教育发布中期业绩 股东应占溢利456.9万元同比扭亏为盈
  • 如何展望行业前景?华夏银行行长瞿纲:政信类、房地产风险预期改善,银行资产质量将保持稳定
  • 塞尔维亚新政府宣誓就职
  • 突发,603156跨界,增资存储芯片巨头!新能源汽车产销两旺,低PE+低PB+超跌绩优股是它们
  • 嘉信理财:上月对等关税宣布后数千散户面临追加保证金风险
  • 关税十日,再聊聊黄金的配置价值
  • 光大期货0423热点追踪:焦煤单日大涨,机会还是陷阱?
  • A股再现巨额分红!000596,10派50元!000651,10派20元!
  • 智勤控股成立全新电子商务平台“数商时代”
  • 乡土地里的“农民发明家”
  • 美国法官裁定苹果公司违令 立即整改
  • IBM财报未能消除投资者对关税和联邦减支负面影响的担忧 股价盘后重挫
  • 第一拖拉机股份发布第一季度业绩 归母净利润5.29亿元同比减少11.66%
  • 工程院院士应汉杰不再担任苏州大学校长
  • 基本面 | 2023年全国房地产开发投资同比下降9.6%
  • 接下来上海很热闹,天后天团轮番来开演唱会
  • 中国经济数据观丨十组数据看一季度经济发展成色
  • 西班牙经济部长:美财长有意与欧盟达成关税协议
  • 关键词: