5月11日消息,据外媒报道,麻省理工学院(MIT)的数学家和认知科学家Peter Park表示,人工智能开发人员对导致欺骗等不良人工智能行为的原因缺乏自信。
Park认为人工智能欺骗之所以出现,是因为基于欺骗的策略被证明是在给定的人工智能训练任务中表现良好的最佳方式。欺骗可以帮助他们实现目标。
事实证明,人工智能系统特别擅长编造谎言的一个领域是游戏。研究人员的工作中有三个值得注意的例子。其中一款是Meta的CICERO,专为棋盘游戏《Diplomacy》设计,玩家通过谈判寻求统治世界。Meta希望它的机器人能够提供帮助并且诚实;事实上,情况正好相反。
研究人员发现:“尽管Meta做出了努力,但CICERO最终被证明是一个撒谎专家。它不仅背叛了其他玩家,而且还进行了有预谋的欺骗,提前计划与人类玩家建立虚假联盟,以欺骗玩家,让他们在攻击时毫无防备。”
但是这并不是唯一一例。DeepMind的AlphaStar是一个为《星际争霸2》设计的人工智能系统,它充分利用了游戏的战争迷雾机制来佯攻,让人类玩家以为它在往一个方向走,而实际上却在往另一个方向走。Meta设计的Pluribus是用来玩扑克的,它能够成功地吓唬人类玩家,让他们折叠牌。
此外,研究人员也指出了其他不那么友善的例子。如经过训练进行模拟经济谈判的人工智能系统学会了如何谎报自己的偏好,从而占据上风。其他旨在从人类反馈中学习以提高表现的人工智能系统学会了欺骗审查人员,通过谎报是否完成任务来给它们打高分。
据悉,这项研究发表在《Patterns》杂志上。
相关阅读