在AI的帮助下 人类能理解动物的“喜怒哀乐”吗?

  • 2022-05-09 11:36
  • 科技日报

目前相关研究只是在一定程度上实现了人与动物之间简单的信息传递,距离真正的跨物种交流还有很长的路要走。短期来看,实现跨物种交流还很困难,但越来越多的研究无疑为其打开了一扇门。

谭维洲王源智库人工智能事业部总监、图灵机器人首席战略官

《安徒生童话》等文学作品,以及很多优秀的影视作品都反映了同一个主题:——人与动物的互动。如今,世界各地的学者都试图通过人工智能等方式打破人与动物之间的语言障碍,真正实现跨物种交流甚至情感交流。

近日,由丹麦哥本哈根大学、瑞士苏黎世联邦理工学院和法国国家农业、食品与环境研究所的研究人员组成的国际研究团队开发出一种人工智能产品,可以翻译猪在各种场景下发出的声音,并成功解码其叫声中传达的“喜怒哀乐”。该研究成果发表在最新一期《科学报道》期刊上。那么,人工智能能否实现人与动物的交流呢?算法具体是怎么区分动物情绪的?目前,人类通过AI理解动物语言需要克服哪些困难?

已通过算法研究多种动物语言

像动物和人一样,他们也有自己的情感。他们会开心,会难过,会害怕,会生气,但是受限于语言和表达,动物的情绪很难知道。事实上,相似动物的声音中可能隐藏着不同的情绪。

上述论文显示,为了训练AI翻译猪的语言,研究人员特意记录了411头家猪在19个不同场景下的7000多次叫声。算法结果表明,猪的积极情绪的声音比消极情绪的声音更短,幅度更低。据研究人员介绍,这种算法的准确率高达92%,可以基本准确地从叫声中识别出猪的情绪。

无独有偶,剑桥大学的一个研究小组此前曾要求AI根据羊的面部表情来识别羊是否遇到了麻烦。AI系统首先根据绵羊疼痛的面部表情,列出几个与不同疼痛程度相关的“面部动作单元”(AUs),然后在480张绵羊照片中标记这些AU——鼻孔变形、每只耳朵的旋转和眼睛的眯起,来判断绵羊的情况。

“其实在算法的帮助下研究动物语言和人与动物的交流是有先例的。之前也有过研究宠物狗和宠物猫的项目。这些研究的目的是让人类更容易更好地与它们相处。”5月4日,王源智库人工智能处处长、图灵机器人首席战略官谭维洲在接受科技日报记者采访时指出。

例如,为了实现人与宠物之间的交流,日本著名声学专家松美铃木博士曾经利用基于机器学习的动物翻译技术发明了一种“宠物狗翻译机”。宠物主人只需要在项圈上贴上一个迷你麦克风,收集到的宠物叫声就会传到翻译机进行语音识别和转换,从而将宠物的意思传达给主人,理解它们的情绪。

“此外,还有研究人员研究简单动物的群体智能,比如蜜蜂和蚂蚁的交流方式。这些研究对军事战术和装备具有一定的仿生参考意义;还有对海豚、鲸鱼等动物组织能力的跨学科研究,对探索生物的进化史非常有价值。”谭玉舟进一步解释道。

不懂语言也能获得翻译能力

动物有自己的语言吗?如果有,他们会聊什么?了解动物可以说是人类长期的研究课题。目前,AI正在帮助我们寻找答案。谭明洲说:“动物没有人类特有的语言系统,研究人员可以结合它们的叫声、行为和习惯来分析它们的诉求,从而更好地理解它们。”

一名研究人员曾经听过两头相对静止的抹香鲸之间断断续续40分钟的“对话”。他们的“对话”几乎每句话都不一样,还伴随着各种动作。这不禁让人怀疑:这两只母鲸是在“聊天”,分享育儿经验吗?对抹香鲸“对话”的研究是近年来由一个国际科学家团队发起并得到《国家地理》支持的鲸语翻译项目(CETI计划)中的研究内容之一。据悉,研究人员正在使用自然语言处理系统(NLP)分析抹香鲸的40亿条通信代码。NLP是人工智能的一个子领域,专注于人类书面语和口语的处理。研究团队计划让人工智能将每个声音与特定的背景联系起来,这个过程预计至少需要5年时间。如果团队实现了这些目标,下一步将是开发和部署一个交互式聊天机器人,与生活在野外的抹香鲸交谈。

发表在《自然》期刊上的科学研究证明,人工智能在破译人类古代语言方面非常有效。这就开启了利用AI探索动物语言的可能性。根据这项研究,机器学习技术提供了新的工具,可以帮助考古学家更快地了解过去,特别是在破译古文字时。AI系统使用古希腊语和整个古代地中海世界的铭文进行训练。训练数据来自相关人文学院提供的最大的希腊铭文数字数据集,这些铭文中的每一个都标有元数据,描述了历史学家检查的铭文的书写地点和时间。有了这些数据,AI可以在这些信息中找到模式和规律,并使用复杂的数学模型对这些信息进行编码,然后进一步利用这些推断出的信息来推断其他铭文的内容、书写地点和年代。研究表明,人工智能在修复受损单词方面达到了62%的准确率。也为翻译动物语言提供了灵感。

人工智能在破解古文字和翻译动物语言时,往往遵循同样的方法和准则。谭明洲说:“在翻译的经典任务中,机器不需要理解语言,只需要依靠单一语言的语料库就能掌握该语言的句法、语法等关键要素。换句话说,深度学习不懂英语和汉语,但是可以通过大量的学习语料库获得中英互译的能力。”

“归根结底,AI可以翻译和理解动物语言,其背后依然是基于人类对语言进行的有效解读。” 谭茗洲说。

实现跨物种交流尚有很长的路要走

“人类的语言有规律可循,因而不同国家的语言是可以遵循规律去学习的。但动物的语言规则存在未知壁垒,因此AI要实现跨物种语言翻译,尚有一段很长的路要走,需要克服一些困难。”谭茗洲表示。

首先,事实证明,利用受人为偏见影响的数据进行训练的算法很容易将结果导向“歧途”。比如,狗会发出急促的叫声,可能是因为想要向主人乞食,也可能是因为提醒主人警惕陌生人,还可能是对主人不陪自己玩的责怪。但如果研究人员仅基于自己的认知,在对这种叫声数据进行标记的时候,认为这种叫声只表达宠物向主人要食物的需求,从而对数据进行单一标记处理,那么人工智能在学习数据、翻译的时候往往就会产生很大的局限性。这种翻译很容易导致人和宠物的沟通障碍,从而丧失宠语翻译的意义。

“在研究中,科研人员需要去‘人类中心’,也就是说,借助于算法实现的跨物种沟通,需要算法避免人类某些偏见。”谭茗洲指出。

其次,通过AI算法将人类语言与动物语言对应,需要大量、广泛、完善的数据采集和场景训练,以完成对动物语言的解读,实现对“规则”的总结。这需要广泛同步采集动物叫声和脑电波数据并进行比对,再将其纳入数据库。然而不同犬种声带特点不同,面对同一场景的发声表现也不同,而这样的场景和叫声的组合有无数个,这为数据采集工作带来了巨大的挑战。

谭茗洲说,在技术方面,一个AI翻译产品做到精确翻译至少需攻破几个难题:在形式端,如果使用拍译的形式要攻克图像识别相关问题,同声翻译形式则要攻克语音识别相关问题;在内容端,AI翻译产品还要攻克文本语言分析、大数据采集等问题。由于AI缺乏对视觉场景、听觉场景、自然语言处理的常识判断,这还需要AI发展到能够极为精确地处理这些问题的阶段。

此外,有学者指出,动物语言和人语之间的代沟是客观存在的,AI所能做的,只能是不断改进自身的功能,用科学手段完善数据库、内容、语料和场景;形式和内容双管齐下,才能将这条横亘在动物和人之间的语言鸿沟填平,在坚实的地基上实现人和动物的有效沟通。

“尽管有些研究也曾获得了很大的进展,但是其中的问题也无法被忽视。目前来看,相关研究仅仅只是在一定程度上实现了人与动物之间简单的信息传递,离实现真正的跨物种交流,恐怕还有很长的一段路要走。从短期来看,要想实现跨物种交流还很难,但越来越多的研究无疑正在为其打开一扇扇大门。”谭茗洲表示。

头条推荐
图文推荐