智商情商兼备的机器人,距离我们还有多远?
让我们假想一下在人工智能高度发达的未来,人类会有怎样的生活?
清晨一缕阳光中,你的个人机器人已经端着一杯咖啡,来到你的床边,将你从睡梦中唤醒。在你享用咖啡的时候,它也轻声细语地报告着你今天的日程。
在它与你的长期陪伴中,它早已知道了关于你的一切,从你一丝一毫地表情变化和只言片语中,它就能察觉你的心情。它是你的最忠诚的伙伴,没有人类的臭脾气,一切只为让你的生活更加快乐顺心。
这并非遥不可及的未来,随着现如今人工智能(AI)与机器人技术的飞速发展,从智能客服到无人驾驶汽车,从医疗健康助手到家庭服务机器人,AI与机器人的结合正以前所未有的方式改变着我们的世界,开头那样的生活,已经正在逐步变为现实。
下面就让我们一起探索在这个充满无限可能的新时代中,情智兼备的AI“智慧生命”(以下简称“数字人”)将会如影响我们的日常,以及又会给我们的社会带来哪些意想之外的改变吧。
情智兼备“数字人”的应用场景
首先,在与我们工作、生活十分贴近的场景中,“数字人”会有哪些有趣的应用场景呢?
医院里的“智能护士”:让我们先看一组数据。根据世界卫生组织《2020年世界护理状况报告》显示,2018年全球每千人拥有护士数量为3.7人,其中美洲为8.3人,欧洲为7.9人。反观中国,每千人注册护士数量从2018年的2.9人增长至2021年的3.5人,仍未达2018年全球平均水平。北京作为医护资源丰富的典型城市,其千人护士数为6.9人,尚不及2018年欧洲平均水平。数据反映到现实生活中,就是患者在医院就医时,医护水平很难达到预期,进而可能会滋生不满,诱发医患矛盾。
而情智兼备的“智能护士”却能让这个问题迎刃而解。它能识别患者的健康、情绪状态,提供个性化的护理和情感陪伴,真正在医疗系统中也做到“随叫随到的保姆式陪伴”,从而提高患者的康复效果和心理健康。
永远不会发火的“好家长”:但凡辅导过孩子家庭作业的家长,大多数都经历过下面的情景:简单的作业,却“百教不会”,于是家长怒了,孩子哭了,一晚上的好心情没了。这是很多家庭的生活常态。此时,如果家中有这样一位“永远不会发火的好家长”—智能家教“数字人”,一切问题就迎刃而解了。它不但什么都会,什么都懂,而且还可以掌握孩子的学习进度和对知识的吸收程度,更能照顾孩子的情绪,找到孩子更喜欢的方法,让辅导作业不再是对孩子和家长的双重折磨,学习成绩的提高便是手到擒来的事了。
如上的应用场景已经让我们对智能“数字人”未来的应用充满期待了,但其实这只是管中窥豹,“数字人”的真正普及,就如同互联网、手机的普及,将让人类的生活发生翻天覆地的变化。
比如,在酒店、餐饮等服务行业,“数字人”可以提供更加人性化的服务,如定制化的路线引导、舒缓顾客对陌生环境的紧张情绪等,真正做到“宾至如归”;在家庭环境中,“数字人”能帮助处理家务,提供情感陪伴,特别是在老人和儿童照顾方面发挥重要作用;在工业生产中,“数字人”能够根据工人的情绪和工作状态,调整生产节奏和任务分配,极大提高工人的工作效率;在军事领域,“数字人”也可以用于情感支持和心理辅导,提高士兵的战斗力和心理素质。
它,距离我们还远吗?
智商情商兼备的“数字人”让人心驰神往。那么,完全体的它距离我们还有多远呢?
在国际领域,头部科技企业和知名高校在多模态情感知识、情感生成与交互、专用芯片与硬件方面已经有了一定的突破。
例如,谷歌和微软的研究团队开发了多模态情感识别系统,表现出色;麻省理工学院和斯坦福大学正在积极开展跨学科合作,结合心理学、神经科学和计算机科学,深入研究情感计算的基础理论和应用技术;OpenAI的GPT系列模型和谷歌的BERT模型等,已经在情感生成方面取得了显著进展。这些模型能够生成富有情感的对话和文本,提高人机交互的自然性和用户体验。
国内在情感计算算法方面也取得了显著进展,特别是在多媒体信息处理、语音和文本情感识别领域。许多研究机构和高校,如清华大学、哈尔滨工业大学及厦门大学等,也正在构建大规模的情感数据集,支持情感计算模型的训练和优化,研发面向多类开放场景的情感计算方法及工具。
国内的科技公司,如科大讯飞和小米,也相继推出了具有情感交互功能的智能客服机器人;百度和阿里巴巴等公司也开发了多模态情感识别系统,在实际应用中提供高效的情感识别和生成服务。此外,还有一些初创公司和研究团队也正在探索情智兼备技术在教育和医疗领域的应用,开发出情感教育助手和陪伴机器人,提升用户的满意度和服务质量。
总得来说,“数字人”的研究在多模态情感识别、情感生成与交互、计算算法、硬件系统设计等方面已经取得了很多重要的进展。我国的研究机构及企业也有望在情智兼备技术方面引领前沿技术的发展。
让“数字人”真正“活起来”!
虽然我们对“数字人”的未来憧憬很丰满,也取得了长足的进步,但现实看起来却仍有点骨感。无论真正人工智能的实现,还是机器人技术的发展,我们距离如上的智能生活,还有一定的距离。
要让“数字人”像人一样真正“活起来”,还有三大难关迫切需要突破:
1、多模态情绪感知能力。我们知道人类感知世界是通过视觉、听觉、味觉、触觉和嗅觉进行的。例如,看似品尝一个苹果这么简单的动作,要完成它却需要我们的大脑对视、触、嗅、味四类感觉器官的精妙调动。机器人也有视觉、听觉、触觉等“感觉器官”,而且其能力要远远超越人类。但它却缺少不同“感觉”间的有效集成、融合,这个对人类大脑来说,不费吹灰之力就能完成的事情,在机器人面前,却如盲人摸象。只有AI克服不同“感觉”间的不一致性和差异性,建立如人类大脑一样协调的配合关系,才能提取出更准确和全面的情感信息,更全面、深入地去了解我们,了解世界。
2、个性化情智分析能力。正如同样的一个汉字,一个词语,语调、语境不同,会变化出很多个意思一样,同样一个表情,也会因为个体差异等因素的影响,存在很大的个体差异。如何能做到“数字人”不会发生误解,并非易事。幸好人工智能有着超强的大模型整合能力。它可以建立适合不同个体的情感模型,从大规模数据中挖掘出个体差异的特征,并将其纳入到情感智能系统中,以实现对个体的个性化情感理解和分析。
3、仿生化情感交互能力。在“数字人”实现仿生化情感交互时,它需要表现出足够的情感真实性,这样才能让人对它产生真实的情感共鸣和连接。而如今人工智能通过算法和数据整合产生的机器人问答,仍会让人感觉不自然和生硬,难以让人对其产生感情。
如果说以上三种能力属于“数字人”在软件层面迫切需要提升的能力,那与之相配合的硬件能力提升,同样迫切。
“数字人”模型需要能够处理“味、触、嗅、视、听”多种传感器生成的数据,而且还要实现实时准确的人机交互,这对要求“数字人”提出了很高的硬件要求,它需要充足的运算能力,以便达到融合计算、低延时、增强学习、推理准确等要求。
在所有硬件中,“芯片”是提升“数字人”能力的关键。在芯片设计上,“数字人”的芯片要有“既要又要还要”的特点。即它既要有满足复杂神经网络计算的高效率,又要尽量降低功耗,以延长续航时间,还要优化数据传输和处理,以尽可能降低延迟,提高实时处理能力。
无论“数字人”在软件还是硬件的进步,它的最终原动力都来源于人才,来源于人才推动的科研进步。所以,要推动“数字人”不断地向最终形态进化,在理论基础方面,还需要进一步加强基础研究,深入研究情感计算和多模态感知的基础理论,研发更加高效的算法和模型。同时,还需要在学科交叉融合方面,加强计算机科学、心理学、脑科学及认知科学等多个学科的交叉融合,让政策、高校、科研院所及科技企业形成合力,才能推动情智兼备技术的大发展。
大家以为OpenAI是2018年做出来了ChatGPT,实际上,人类花了六七十年的努力,才走到了今天。你知道现在用的神经网络是什么时候开始研究的吗?是1943年。也就是说,人类花了70多年时间,才得到今天的Transformer模型,进而开启了全新的人工智能时代。而真正智商情商兼备的“数字人”完全体的落地,同样也可能经历这样漫长过程,但是只要全社会对它抱有持续的期待,也许质变的突破很快便会到来。
本文为科普中国·创作培育计划扶持作品
作者:环球时报
出品:中国科协科普部
监制:中国科学技术出版社有限公司、北京中科星河文化传媒有限公司