创造有感觉的AI

具有情商的人工智能系统可以学得更快,更有帮助

12分钟读取
垂直
创造有感觉的AI
埃迪的家伙
LightBlue

在过去的一年,你发现自己有压力吗?你是否曾希望得到帮助?想象一下,如果在大流行期间,你有一个由人工智能系统提供支持的虚拟治疗师,这个实体与你感同身受,并逐渐了解你的情绪和行为。网上亚博Ayabo2016我们认为,能够识别和解释情绪的人工智能系统可以为人们带来巨大益处,治疗只是其中一个领域。

我们的团队来自微软人类的理解和同理心团队,我们的使命是为科技注入情商。为什么?有了这种品质,人工智能就能更好地理解用户,更有效地与他们沟通,并改善他们与技术的互动。生产具有情感智能的人工智能的努力建立在心理学、神经科学、人机交互、语言学、电气工程和机器学习的基础上。

最近,我们一直在考虑如何改进人工智能语音助手,比如Alexa和Siri,现在很多人都把它们作为日常助手。我们预计,它们很快就会被部署在汽车、医院、商店、学校等地方,在那里,它们将与技术进行更个性化、更有意义的互动。但要实现它们的潜力,这类语音助手将需要来自计算机领域的重大推动情感计算.这个词是麻省理工学院的教授发明的罗莎琳·w·皮卡德在1997年顾名思义,人工智能指的是能够感知、理解甚至模拟人类情感的技术。以情商为特征的语音助手应该比那些没有情商的语音助手更自然、更高效。

想想这样一个人工智能代理如何帮助一个被压力压得喘不过气来的人。目前,最好的选择可能是去看一位真正的人类心理学家,他会通过一系列昂贵的咨询,讨论这种情况,并教授相关的压力管理技巧。在治疗过程中,治疗师会不断评估患者的反应,并利用这些信息来决定讨论的内容,调整内容和表现形式,以确保获得最佳结果。

虽然这种治疗方法可以说是现有的最好的治疗方法,虽然技术还远远不能复制这种体验,但对一些人来说并不理想。例如,某些人会觉得与治疗师讨论自己的感受不舒服,有些人觉得这个过程是耻辱或耗时的。人工智能治疗师可以为他们提供另一种支持途径,同时还可以进行更频繁和个性化的评估。最近的一篇评论文章发现,10亿人在全球范围内都受到精神和成瘾障碍的影响;一个可扩展的解决方案,如虚拟咨询师,可能是一个巨大的福音。

有证据表明人们可以感觉更投入而且更多愿意透露敏感信息当他们和机器说话时。然而,其他研究发现,人们从在线平台寻求情感支持更喜欢来自人类的回应即使内容是一样的。显然,我们需要在这个领域进行更多的研究。

全球约有10亿人受到精神障碍的影响;人工智能治疗师等可扩展的解决方案可能是一个巨大的福音。

在任何情况下,人工智能治疗师都有一个关键优势:它总是可用的。因此,它可以在意想不到的危机时刻提供关键的支持,或者利用一个人想要进行更多分析性谈话的时候。它可能会比人类治疗师通过偶尔的会议收集更多关于人的行为的信息,它可以提供提醒,让人保持正轨。随着大流行大大增加了远程医疗方法的采用,人们可能很快就会发现,通过电脑或手机显示器获得代理的指导是非常正常的。

不过,要想让这种虚拟治疗师发挥作用,需要很高的情商。它需要感知和理解用户的偏好和波动的情绪状态,这样才能优化交流。理想情况下,它还可以模拟某些情绪反应,以促进同理心,更好地激励人。

虚拟治疗师并不是什么新发明。第一个例子出现在20世纪60年代,当时麻省理工学院的约瑟夫·韦岑鲍姆(Joseph Weizenbaum)为他的剧本写了剧本伊丽莎自然语言处理程序,它经常在极大简化的心理治疗模拟中向用户重复他们的话。2000年代,南加州大学(University of Southern California)创意技术研究所(Institute for Creative Technologies)进行了一项更严肃的研究SimSensei这个虚拟人最初是为军事人员提供建议而设计的。今天,最著名的例子可能是Woebot,这是一个免费的聊天机器人,提供基于微博的对话认知行为疗法.但在我们看到人工智能系统真正理解人类情感的复杂性之前,还有很长的路要走。

我们的团队正在做基础工作,这将导致这种复杂的机器。我们还在探索,如果我们构建的人工智能系统是由类似人类情感的东西驱动的,会发生什么。我们认为,这种转变将把现代人工智能已经令人印象深刻的能力提升到一个新的水平。

就在十年前,情感计算需要定制的硬件和软件,这反过来又需要有高级技术学位的人来操作。这些早期的系统通常涉及笨拙的大传感器和笨重的电线,这很容易影响佩戴者的情感体验。亚博排列五投注网站

如今,高质量的传感器都是微型无线的,能够亚博排列五投注网站不引人注目地估计一个人的情绪状态。我们还可以使用手机和可穿戴设备来研究现实生活中的人类本能体验,在现实生活中,情感确实很重要。我们现在可以研究随着时间的推移的情绪,并从“野外”的大量人群中获取数据,而不是在小群体中进行短期的实验室实验。

说明不同的读数,以帮助预测情绪状态。要预测一个人的情绪状态,最好结合各种数据。在这个例子中,分析面部表情的软件检测视觉线索,跟踪可以显示情绪的细微肌肉运动(1)。生理监控器检测心率(2),语音识别软件转录一个人的话,并从音频中提取特征(3),比如讲话的情绪语调。克里斯Philpot

情感计算的早期研究通常用单一参数来测量情绪反应,比如心率或语调,并且是在人工设计的实验室环境中进行的。由于人工智能的重大进步——包括自动语音识别、场景和物体识别以及面部和身体跟踪——今天的研究人员可以做得更好。结合使用语言、视觉和生理线索,我们可以更好地捕捉某些情绪状态的微妙之处。

我们还在建立新的心理学模型,以更好地解释人们如何以及为什么表达他们的情绪。例如,心理学家批判了普遍的观念某些面部表情总是暗示着某些情绪,认为微笑和皱眉等表情的含义根据上下文有很大差异,也反映了个人和文化差异。随着这些模型的不断发展,情感计算也必须不断发展。

这项技术引发了一系列社会问题。首先,我们必须考虑收集和分析人们的视觉、语言和生理信号对隐私的影响。减轻隐私担忧的一种策略是减少需要离开传感设备的数据量,使通过这些数据识别一个人变得更加困难。我们还必须确保用户始终知道他们是在与人工智能还是人类对话。此外,用户应该清楚地了解他们的数据是如何被使用的,并知道如何选择退出或在可能包含情绪感应剂的公共空间中保持不被注意。

随着这类代理变得越来越现实,我们还必须努力解决“恐怖谷现象,人们发现有些逼真的人工智能实体比更明显的合成生物更令人毛骨悚然。但在我们面对所有这些部署挑战之前,我们必须让技术发挥作用。

作为第一步一个可以支持人们心理健康和幸福的人工智能系统,我们创建了Emma,一个情感感知手机应用程序2019年的一个实验,艾玛在一天中的任意时间询问用户的感觉。然后,他们中的一半人得到了艾玛根据他们的情绪状态量身定制的同理心回应,而另一半人则得到了中性的回应。结果是:那些与移情机器人互动更频繁的参与者报告了积极的情绪。

在一个第二个实验在同一组人中,我们测试了是否能从基本的手机数据推断人们的情绪,以及建议适当的健康活动是否能让那些情绪低落的人振作起来。仅使用位置(用户离家或工作地点的距离)、一天中的时间和一周中的哪一天,我们就能够可靠地预测用户的情绪状况情绪象限模型

根据用户是高兴、平静、激动还是悲伤,艾玛会用适当的语气回应,并推荐一些简单的活动,比如深呼吸或和朋友聊天。我们发现,收到艾玛的同理心敦促的用户更有可能采取建议的行动,并且比从中立机器人那里收到相同建议的用户更快乐。

来自手机应用程序的屏幕插图在情感感知手机应用Emma的早期实验中,用户被要求使用情绪象限模型对自己一天中的情绪状态进行多次评估。克里斯Philpot

我们还从手机上收集了其他数据:它内置的加速计为我们提供了用户活动的信息,而来自电话、短信和日历事件的元数据则告诉我们社交接触的频率和持续时间。一些技术上的困难使我们无法使用这些数据来预测情绪,但我们希望包含这些信息只会使评估更加准确。

在另一个研究领域,我们正在努力帮助信息工作者减轻压力,提高工作效率。我们已经开发了许多生产力支持工具的迭代,最近的是我们在“焦点代理”上的工作。这些助手会在用户的日历上安排时间,让他们专注于重要的任务。然后,他们监控用户对计划的遵守情况,在出现干扰时进行干预,在适当的时候提醒他们休息一下,并帮助他们反思自己的日常情绪和目标。这些代理访问用户的日历,观察他们的电脑活动,看看他们是否在使用Word等有助于提高工作效率的应用程序,还是在浏览社交媒体。

为了研究情商是否会改善用户体验,我们创建了一个焦点代理以友好的头像出现在屏幕上。该代理使用面部表情分析来估计用户的情绪,并依靠人工智能驱动的对话模型以适当的语气做出回应。

我们将这个化身代理的影响与一个无情感的基于文本的代理进行了比较,也与现有的微软工具进行了比较,后者仅允许用户安排时间集中工作。我们发现,这两种代理都能帮助信息工作者保持专注,而且人们使用与生产力相关的应用程序的时间比例比使用标准调度工具的同事要大。总体而言,用户报告说,他们对基于虚拟形象的代理的工作效率和满意度最高。

我们的智能体擅长预测一部分情绪,但在识别更微妙的状态(如专注、无聊、压力和任务疲劳)方面仍有工作要做。我们也在优化互动的时机,这样它们就被视为有益的,而不是令人恼火的。

如果一个人工智能的动机是恐惧、好奇或喜悦,这将如何改变技术及其能力?

我们发现一个有趣的现象,那就是人们对我们有同理心的化身的反应是两极化的。一些用户在互动中感到舒适,而另一些人则发现虚拟形象分散了他们的工作注意力。对于这种代理应该如何表现,人们表达了广泛的偏好。虽然理论上我们可以设计许多不同类型的代理来满足许多不同的用户,但这种方法将是一种低效的扩展方式。最好是创建一个能够适应用户通信偏好的单一代理,就像人类在交互中所做的那样。

例如,许多人会本能地选择与他们交谈的人的谈话风格;这种“语言模仿”已被证明可以增加同理心、融洽关系和亲社会行为.我们开发了第一个AI代理的例子执行相同的技巧匹配对话伙伴的说话习惯,包括音高、响度、语速、用词和语句长度。我们可以想象将这种风格匹配集成到焦点代理中,以创建更自然的对话。

我们一直在和微软的产品团队讨论我们的研究。我们还不知道我们的哪些努力会在未来五年内出现在办公室职员的软件中,但我们有信心,未来的微软产品将包含情商人工智能。

可以预测的人工智能系统并对人类情感做出反应是一回事,但如果人工智能系统真的能体验到类似人类情感的东西呢?如果一个智能体的动机是恐惧、好奇或喜悦,这将如何改变技术及其能力?为了探索这个想法,我们训练了具有恐惧和快乐好奇心等基本情感驱动力的代理。

通过这项工作,我们试图解决人工智能领域中被称为强化学习的一些问题,在这个领域中,人工智能代理通过不懈的尝试和错误来学习如何完成一项任务。经过数百万次的尝试,智能体找出了最佳的行动和策略,如果它成功完成了任务,它就会获得奖励。强化学习已被用于训练人工智能代理来击败人类围棋棋盘游戏,视频游戏星际争霸2的一种类型德州扑克

信息图显示了一个由人工智能驱动的对话机器人我们的“焦点代理”旨在通过帮助用户安排时间来完成重要任务并帮助他们坚持自己的计划来提高工作效率。摄像机(1)和计算机软件(2)记录着用户的行为。传感框架(3)检测视野中的人数和用户在计算机屏幕前的位置,估计用户的情绪状态,并跟踪用户在各种应用程序中的活动。代理应用程序(4)控制让用户参与对话的焦点代理化身,使用人工智能驱动的对话机器人(5),该机器人利用各种对话模型来适当地响应情况。克里斯Philpot

虽然这种类型的机器学习在游戏中效果很好,因为获胜会提供明确的奖励,但在现实世界中却很难应用。例如,考虑训练一辆自动驾驶汽车的挑战。如果奖励是安全到达目的地,AI就会在尝试不同策略时花费大量时间去撞东西,并且很少会成功。这就是外部奖励稀少的问题。人工智能也可能需要一段时间才能弄清楚哪些具体行动是最重要的——它是在闯红灯时停下来,还是在空旷的街道上加速?因为奖励只有在一长串行动的最后才会出现,研究人员称之为信用分配问题。

现在想想人类开车时的行为。安全到达目的地仍然是目标,但是这个人在路上会得到很多反馈。在有压力的情况下,比如在暴雨中在高速公路上超速行驶,人们可能会因为肾上腺素和皮质醇在他的身体中流动而感到他的心脏在胸部砰砰跳得更快。这些变化是人的战斗或逃跑反应的一部分,会影响决策。驾驶员不需要真的撞上什么东西来感受安全操作和危险操作之间的区别。当他离开高速公路时,他的脉搏变慢了,事件和反应之间有明显的相关性。

我们想要捕捉这些相关性并创造一个某种程度上有恐惧的人工智能.因此,我们要求人们在模拟环境中驾驶汽车穿过迷宫,测量他们在平静和紧张时刻的生理反应,然后使用这些数据来训练人工智能驾驶代理。我们为智能体编写了程序,让它在探索迷宫的一定比例时获得外部奖励,在将危险情况下的情绪状态最小化时获得内在奖励。

我们发现,将这两种奖励结合起来,会比只接受典型外部奖励的代理学习得更快。这些代理也不经常崩溃。然而,我们发现特别有趣的是,一个主要由内在奖励激励的智能体表现得不太好:如果我们降低外部奖励,智能体就会变得非常厌恶风险,以至于它不会非常努力地完成它的目标。

在另一项为AI代理建立内在动机的努力中,我们考虑了人类的好奇心,以及人们是如何被驱使去探索的,因为他们认为他们可能会发现让他们感觉良好的东西。在相关的人工智能研究中,其他研究小组捕捉到了类似于基本好奇心的东西,在探索模拟环境时奖励那些寻求新奇事物的智能体。但我们想要创造一种更挑剔的代理,它不仅寻找新奇的东西,而且是新奇的东西可能会让它“快乐”。

img当受试者开车穿过虚拟迷宫时,我们记录了他们每次脉搏的血量。在这个例子中,受试者的血容量在285秒到300秒之间减少。在此期间,司机在急转弯以避开另一个障碍物时撞上了一堵墙。这些数据被用来训练一个AI代理,其目标是最大限度地减少这种压力情况。克里斯Philpot

为了为这样的智能体收集训练数据,我们要求人们在模拟的街道迷宫中驾驶虚拟汽车,告诉他们探索,但不给他们其他目标。当他们开车时,我们使用面部表情分析来跟踪他们在成功通过棘手的部分或意外找到迷宫出口时掠过脸上的微笑。我们使用这些数据作为内在奖励函数的基础,这意味着智能体被教会最大化会让人微笑的情况。代理人通过覆盖尽可能多的领土来获得外部奖励。

我们再次发现,融合了内在驱动力的智能体比一般受过训练的智能体表现得更好——他们在迷宫中行驶的时间更长,然后撞到墙上,他们探索的领域也更多。我们还发现,这种智能体在相关的视觉处理任务上表现得更好,比如估计3D图像的深度和将场景分割成多个组成部分。

我们正处于用硅片模仿人类情感的起步阶段,毫无疑问,对于一台机器能够模仿与快乐或恐惧相关的情感状态意味着什么,将会有哲学上的争论。但我们认为,这种方法不仅可以提高学习效率,还可以赋予人工智能系统至关重要的泛化能力。

今天的人工智能系统通常被训练来执行单一的任务,一项他们可能非常擅长的任务,但他们不能将辛苦获得的技能转移到任何其他领域。但人类每天都在用自己的情绪来帮助应对新情况;这就是人们所说的凭直觉行事的意思。

我们希望赋予人工智能系统类似的能力。如果人工智能系统是由类人情感驱动的,它们会更接近类人智力吗?也许模拟情绪可以刺激人工智能系统取得比其他情况下更多的成就。我们当然很好奇探索这个问题——部分原因是我们知道我们的发现会让我们微笑。

本文发表在2021年5月的印刷版上,题为“构建一个有感觉的AI”。

对话(0)

3种方法帮助NASA的全电动飞机起飞

N3-X计划于2040年推出,最多可搭载300名乘客

3分钟读取
一架飞机在云层中飞行的插图

美国宇航局提出的全电动N3-X飞机载客量将是目前电动飞机的10倍。

美国国家航空航天局

这篇文章是我们独家报道的一部分IEEE期刊手表系列与IEEE Xplore合作。

全电动飞机的竞争正在进行中,一些早期设计正在成为头条新闻。在过去的九月,一个原型Eviation爱丽丝完成了8分钟的首飞,以及更多的型号等Heart Aerospace的ES-30,预计将在未来几年内首次亮相。然而,到目前为止,所有这些型号的设计都只能搭载30名或更少的乘客,而且飞行距离很短。

例如,Eviation Alice只能让两名机组人员和九名乘客在200米的距离上飞行463公里ES-30的全电动型号虽然设计最多可搭载30名乘客,但其航程仅为200公里。为了真正降低温室气体排放,缓解气候变化的影响,需要更大的全电动飞机。值得注意的是,大型飞机的温室气体排放占航空业温室气体排放的75%以上,考虑到历史上航空旅行每年增长4%至5%,这些排放可能会随着时间的推移而恶化。

继续阅读↓ 显示更少

利用数据科学和人工智能打击野生动物贩运

纽约大学坦顿分校的朱莉安娜·弗莱雷(Juliana Freire)领导着一个团队,旨在利用数据科学打击贩卖人口和珍稀动物的犯罪分子

5分钟读取
一只五颜六色的鹦鹉被关进了监狱

野生动物走私有了一个意想不到的新敌人:计算机科学、数据科学和机器学习。

在上面

这篇文章是由纽约大学坦顿工程学院

野生动物走私是一个利润丰厚的市场。虽然很难确切地说出它带来了多少钱,但美国政府估计每年有数十亿美元。动物及其器官的交易就像枪支或毒品一样——通过复杂的供应商、经销商和买家网络进行交易,这些人在他们身后留下了一条血腥的道路。破坏是不言自明的;物种灭绝,环境恶化,无辜的人受害。

继续阅读↓ 显示更少
{“imageShortcodeIds”:[]}
Baidu