大家好,欢迎来到《修复未来》,这是IEEE频谱播客系列节目,讲述的是可以让亚博真人yabo.at我们走上可持续发展、有意义的工作和有益于所有人的健康经济的正确道路的技术。《修复未来》由COMSOL赞助COMSOL多物理场仿真软件.我是史蒂文·切里。
伦纳德嘿,佩妮。工作怎么样?
一分钱:太好了!我希望我是芝士蛋糕工厂的服务员整个生活!
谢尔登:这是讽刺吗?
一分钱:没有。
谢尔登:这是讽刺吗?
一分钱:是的。
史蒂文樱桃这是《生活大爆炸》第二季里的莱纳德、佩妮和谢尔顿。剧迷们都知道谢尔顿是否理解讽刺是一个问题。在某些情节中,他做到了,而在其他情节中,他只是在学习。但毫无疑问,计算机并不理解讽刺,或者直到中佛罗里达大学的一些研究人员开始让它们学习讽刺。软件工程师们研究各种各样的情感分析已经有一段时间了。早在2005年,我在《Spectrum》杂志上写过一篇文章,讲的是呼叫中心会自动扫描来电者或服务接线员的对话,以寻找他们是否生气。类似此调用的消息背后的早期用例之一可能出于质量保证目的而被监视。从那以后,软件在检测快乐、恐惧、悲伤、自信方面变得越来越好,现在终于可以检测讽刺了。我今天的嘉宾,Ramia Akula先生她是中佛罗里达大学复杂自适应系统实验室的博士生和研究生研究助理。她至少发表了11篇论文,包括最新的可解释的多头自我注意力架构,用于社交媒体中的讽刺检测,该架构于3月与她的导师伊万·加里贝·拉米亚(Ivan Garibay Ramia)共同发表在《熵》(Entropy)杂志上。欢迎来到播客。
Ramya Akula先生谢谢你!很高兴来到这里。
Ramya,也许你可以告诉我们一些情绪分析是如何处理愤怒,悲伤和快乐的。那么讽刺又有什么不同之处呢?
Ramya Akula先生所以总的来说,理解人们情绪背后的情感就像理解各种情绪一样。这一直都很难。实际上,在某种程度上,当你面对面交谈时,可能所有的视觉线索和肢体动作都有助于谈话。但当我们不知道谁坐在电脑或手机后面时,这总是很困难。这适用于所有的情感。这包括愤怒,情绪,幽默,还有讽刺。这就是本研究的出发点。
史蒂文樱桃是什么让讽刺比其他的更难呢?
Ramya Akula先生所以有时候讽刺可以是幽默,但它也会深深地伤害人们。还有人们如何理解它,因为人们来自不同的文化,不同的背景。在某些文化中,有些事情可能没问题,但在另一些文化中就不是这样了。考虑到这些不同的文化、背景,以及人们使用的俗语和俚语,这些都是我们在日常对话中面临的一些挑战,尤其是在讽刺检测方面。
史蒂文樱桃计算机写新闻和体育报道已经有一段时间了,它把一堆事实变成简单的叙述。不过,专业作家对这一发展并不特别担心,因为他们认为,当涉及到微妙的、微妙的、创造性的写作形式时,计算机还有很长的路要走——可能永远都不会走了。作家们主要依靠讽刺、讽刺和幽默来保住他们的工作,甚至保住他们的灵魂。一言以蔽之,他们所依赖的是潜台词。你是想教计算机理解潜台词吗?
Ramya Akula先生准确地说,这些算法…算法最难的工作之一就是理解上下文,这是我们人类非常擅长的,所以任何人都可以理解上下文,然后根据上下文继续内容,但对于算法来说,这总是很困难的,因为当你有这么长的句子时,这些长句子中的单词之间有语义相似性或某种关系,理解上下文,然后想出下一个句子,或者想出某种情感,比如幽默或讽刺,或者这些情感,给文本增加了另一个层次的复杂性。然而,在机器学习社区,他们开始像大多数研究人员一样,通过观察不同的表示来解决这个问题。所以把句子按它本来的样子,然后把它分成几个部分,比如短语,然后对每个短语有不同的表示。所以为了理解上下文,然后把所有的上下文放在一起,然后写出一个有意义的句子。我觉得它还处于一个非常初始的阶段。我们还有很长的路要走。
你从社交媒体上的帖子开始。在某些方面,这似乎是一个更简单的问题,在某些方面,这比呼叫中心的音频更难。你没有语调和语调,我认为在真实的对话中,这通常是我们所谓的人际讽刺检测的线索。
Ramya Akula先生是的。所以在语音识别中,这是一个优势,我们观察语音的内涵,或者声音是如何调制的,然后这些信号会帮助我们更好地理解它。但是当我们从所有的文章或我们每天看到的在线对话中看到真实的文本时。所以没有任何压力,也没有任何你能联想到的内涵。这就是算法很难发现的地方。是的。阿多,为了检查幽默或讽刺的严重性。
史蒂文樱桃如果我理解了你论文中的一些内容,神经心理学家和语言学家显然已经在研究讽刺,但通常是通过识别讽刺词和标点符号,以及所谓的情感转变。但是这些是什么呢?你也用过吗?
Ramya Akula先生所以神经语言学或心理学家,他们主要研究。所以他们得到的数据主要来自真实的人类和真实的对话。所以当他们看文字的时候,是真人写的文字,是真人在理解文字的意义。正确的。我们人类,就像我之前说的,我们很擅长通过阅读或者通过任何形式的交谈来理解语境。我们善于理解上下文。在我们的例子中,因为我们没有人参与任何数据分析部分,所以所有的预处理都是自动完成的。是算法在起作用。
所以我们肯定会使用一些线索。对于机器学习部分,我们有标记的数据,就像给出一个句子,它被标记为讽刺,有讽刺或没有讽刺,然后数据被分为训练和测试。所以我们使用这些数据来训练我们的算法,然后在看不见的注释数据上测试它。在我们的例子中,因为数据已经被标记了,所以我们使用这些标签,在我们的例子中,我们使用权重来理解线索是什么。所以,我们的算法不是看句子中的线索,而是看给我们单词线索的权重。
史蒂文樱桃关于这个我们可以多说一点。这里有很多人工智能,我收集,它包括预先训练的语言模型,帮助你把一个句子分解成你所谓的词嵌入。它们是什么?这些模型是如何工作的?
Ramya Akula先生所以基本上,计算机可以用数字来理解一切。正确的。所以我们必须把单词转换成数字,这样算法才能理解。这已经被提出来了。这个嵌入基本上就是把现实世界转换成数字向量。在我们的例子中,我们使用了多个结尾。这里有很多嵌入。所以从[听不清]到我们每天都能看到的最新的GPT[广义预训练变形器],它产生了大量的数据。
所以在我们的案例中,我们使用了BERT-BERT是目前最新的嵌入技术之一。BERT代表来自变压器的双向编码器表示。我知道这有点拗口,但它的基本工作就是把单词——一个句子中的单个单词——试着把每个单词和其他单词联系起来,从左边和右边,也从右边到左边。BERT以这种方式工作的主要原因是它试图理解位置编码。
这就是接下来要讲的。比如,我工作时需要苹果。那么在这种情况下,用户的意思是工作时需要水果苹果还是工作时需要苹果小工具?这取决于上下文。正确的。就像我说的,人类可以理解上下文,但对于一个算法来说,无论是小工具还是水果,它都取决于整个句子或对话。所以BERT所做的,基本上就是观察这些单独的位置编码,然后试图找到相似之处,或者是最接近的相似词,然后把它们放在一起。所以它在从右到左和从左到右的方向上都起作用。
所以为了更好地理解和理解语义相似性。同样地,我们也有不同的东西,比如Elmo[来自语言模型的嵌入]。我们尝试了不同的嵌入类型,所以我们有BERT、ELMo和其他几种嵌入类型。所以我们把这部分加入到我们的研究中,所以这只是初始层。这是一种转换,将真实的单词转换成数字,使之适合算法。
史蒂文樱桃我猜你认为这可以帮助推特和脸书更好地发现喷子。是说它可以帮助检测各种不真诚的言语吗?
Ramya Akula先生是的,确实如此。这是一个简短的回答。但是调整算法是…这取决于公司是否愿意这样做,但这是主要的想法——帮助遏制网上不健康的对话。所以这可能是任何事情,从喷子,欺凌,一直到错误信息传播。所以这是一个广泛的范围。所以,是的。
史蒂文樱桃你认为像呼叫中心那样处理音频会有帮助吗?首先,它会把标点符号转换成它们所代表的音调和变化。
Ramya Akula先生所以最准确的答案是肯定的。但是还有另一个过滤器,或者实际上,增加了一个额外的层。首先他们要分析音频形式。正确的。在音频中,我们也能得到提示,就像我之前说的。所以我们是根据音频判断的。我的意思是,内涵是给我们和其他人另一组有用线索的表达。但当对话再次被转录后,我们的算法就可以发挥作用了。所以,是的,我们的算法可以帮助使用任何类型的语音合成或任何应用在呼叫中心或任何声音记录器之类的东西。是的,我们也会加入演讲部分。
史蒂文樱桃拉米亚,你来美国之前在印度获得学士学位,在德国获得硕士学位。你会说五种语言。其中两种显然是德拉威语。我有两个问题要问你。为什么选择中佛罗里达大学,下一个选择是什么?
Ramya Akula先生我的硕士是在德国凯泽斯劳滕技术大学读的,我的硕士论文主要是关于社交网络的可视化。这是在2014年。这就是我开始从事社交网络工作的时候。我非常着迷于了解人们如何适应生活中的变化,如何适应技术,以及网络生活如何不断变化。
例如,在新冠疫情之前和之后,我们是如何从面对面过渡到完全虚拟的世界的。所以当我在写关于社交网络的硕士论文时,我对这个话题非常感兴趣。然后我又在这个行业工作了一段时间。但话又说回来,我想回到学术界去追求……进入研究领域,实际上是为了了解,而不是在某个行业为某人开发一些东西。我想也许我可以做一些研究,试着了解和获得更多关于这个领域的知识。
于是我开始考虑不同的选择。其中一个选择是和Ivan Garibay合作因为他有美国国防部高级研究计划局SocialSim项目。这是一个650万美元的项目。但这个项目的整体理念真的很吸引人。它着眼于人类模拟,人类如何在各种在线社交媒体网络上表现。所以当我写这个项目和他的实验室的时候,我认为这是我的主要轨迹指向这个实验室和我的工作。
所以这个项目也是那个大项目的一部分。展望未来,我想在一家初创公司工作,在那里我可以学习,因为每天都是一个学习的过程;我们可以学习很多东西。
史蒂文樱桃似乎这些都适用于聊天机器人。这是一个可能的方向吗?
Ramya Akula先生聊天机器人吗?是的,这是问答系统中的一个应用。但还有更多的事情要做。所以不只是用自动化的方式分析问题和回答问题。所以它不能应用于很多事情,不仅仅是在线对话,还包括个人助理。所以这也适用于个人助理。
史蒂文樱桃计算机打败了国际象棋世界冠军。这令人印象深刻,赢得比赛更令人印象深刻。击败《危险边缘》(Jeopardy)的冠军让人印象深刻,至少直到你意识到这主要是电脑比人类更了解维基百科(Wikipedia)。但大约四年前,卡内基梅隆大学的一台计算机在扑克游戏中击败了一些顶级玩家,这需要在某种意义上理解虚张声势。这与扑克和围棋完全不同。这种带有讽刺意味的发展似乎也是类似的进步。
Ramya Akula先生所以使用这些算法的主要优势是,就像我说的,它们非常擅长理解不同的模式。正确的。我们作为一个人,在这个意义上是有限的,我们在某项任务中有多少专业。所以理解不同的模式和学习模式实际上是匹配的模式总是有限制的。这就是我们可以得到类似算法帮助的地方,比如我们的讽刺检测器或任何其他机器学习算法,因为它们会查看所有可能的组合。机器学习的美妙之处在于算法知道什么时候应该停止学习。
或者程序员看到训练量减少了,当训练量下降时,他就会知道它开始衰减了。比如,所有的数据都是吻合的。所以我们必须停止训练。这些都是程序员停止培训的迹象。
但是在训练之后,我们可以看到这些模式学得有多好。所以之前所有不同的机器学习算法,确切地说是强化学习算法所取得的成就,是它可以看到所有不同的,我的意思是,获胜机会的各种组合。是的。就像最后一次获得所有的数据,然后从中学习。就像大部分的这些也有某种反馈循环。所以它从中学习。所以有时候程序员会帮忙,或者是参与训练的人,有时候机器学习训练会自己学习。是的。所以这些算法帮助我们更好地理解模式,我们人类更好地理解上下文。
史蒂文樱桃嗯,拉米亚,世界上有两种人,一种是讨厌讽刺的人,一种是靠讽刺生活的人。我有时会想,如果两个人在这条线的两端,他们就不可能拥有友谊或浪漫。我想不出比一个懂讽刺的机器人更令人兴奋和恐惧的前景了。令人兴奋的是,也许有一天我可以和Siri进行真正的对话;令人恐惧的是,这意味着软件很快就能写出比我更好的小说,而不仅仅是体育记录——更不用说天网的进步了。但是感谢你今天参加我们的节目。
Ramya Akula先生不用谢。和你谈话很有趣。
史蒂文樱桃我们采访了中佛罗里达大学的博士生拉米·阿库拉,他在检测讽刺方面的研究是情感分析领域的重大进步,最近发表在了该杂志上熵.
《修复未来》由COMSOL他是数学建模软件的制造商,也是数学建模软件的长期支持者亚博真人yabo.at作为一种与工程师联系和沟通的方式。
本期《修复未来》由亚博真人yabo.at是美国电气与电子工程师学会的会员杂志,该学会是一个致力于为人类造福而发展技术的专业组织。
本次采访于2021年5月21日通过Zoom在Adobe Audition上录制,并在Audacity中编辑。我们的主题音乐是查德·克劳奇。
你可以在Spotify、Stitcher、Apple、谷歌和其他任何你获得播客的地方订阅《修复未来》,或者在Spectrum网站上收听,该网站还包含我们所有剧集的文本。我们欢迎您在网络或社交媒体上提供反馈。
无线电频谱,我是史蒂文樱桃.