中美日机器人技术大比拼:日本明显领先

2019-07-09 11:06

  上周台湾鸿海联手日本软银以及大陆的阿里巴巴推出一款人形机器人Pepper。这款手售价约1万元人民币的机器人,首批300台在推出1分钟内就被抢购一空。Pepper具有识别表情和对话的能力,可用于导购和照顾老人病患。它是世界最著名的电子生产企业与IT风投公司、互联网公司的一次强强联合,昭示着机器人正在从科幻、科研、生产逐步走入人们的生活中。

  日本暂领先

  1.jpg

  东芝美女机器人

  仿生机器人是一种在外观上模仿人类或其他生物的机器人。日本人对于其中的人形机器人有着近乎狂热的追逐,全世界有四成机器人在在日本,日本也是世界上拥有机器人最多的国家。

  日本在机器人方面的强大是有其深厚工业基础的,控制机器人精密动作的伺服电机主要被日本、德国、美国所垄断,其中包括了被大众熟知的松下、三菱等企业。

  在日本,有非常多的公司已推出机器人成型产品,包括面向企业和大众。这些人形机器人价格不菲,从几万美元到几百万美元都有。其中最有名的当属日 本本田公司的ASIMO机器人,他外形酷似宇航员,具备听觉和视觉。ASIMO可以识别人类的面部表情和听懂人类语言,最重要的是他的手和脚都可以完成复 杂的动作。他的手可以完成拧开杯盖的动作,甚至能打出手语,双脚可离地奔跑,最高时速可达9公里。

  今年CES上,东芝公司推出了一款美女,她能够实现手语交流,并拥有全球最高级的面部表达能力。可以通过43个气压传动装置提供安静、迅速、流畅的肢体运动。它的主要用途是为老人和病患提供帮助。

  除日本企业外,美国也有公司在研发类似产品,其中一家名为波士顿动力近期开始步入公众视野,该公司成立于1992年并在前年被谷歌公司收购。波士顿动力一直与美国军方有合作,最著名的是BigDog的机器狗项目。这种机器狗可以在各种复杂地形包括光滑冰面行走,被人踹后也能保持平衡而 不倒。同时,该公司也有Atlas双足站立的机器人,也由美国军方赞助,他拥有两套视觉系统和在崎岖地形行走攀登的能力。美国企业显然是看中了机器人在战 争中搜索侦查和背驮货物的能力。

  人形机器人在机械方面还存在着不少问题,由于人类四肢的复杂度,对于机械部件设计有着很高的要求。而且直立行走能力还有很大的改进空间,从近期国外举办的机器人奔跑大赛中可以看出,直立行走对于技术积累不足的企业还是很大的挑战。

  鉴于日本企业几十年来在硬件上的技术积累,他们能在人形机器人上取得如此成就也就不足为奇了。这一方面让人感叹日本机械和电子工业的发展高度,另一方面也让人产生疑问:日本是不是对机器人的外观太过于执着而忽视了内在。

  美国专注内在

  2.jpg

  波士顿动力机器狗

  美国企业对于仿生机器人的关心程度不如日本那样强烈。除了机械方面,美国在机器人的内在,即人工智能方面的研究,要比日本要深入得多。

  早在上世纪90年代,国际商用机器公司(IBM) 就在研发专门用于国际象棋的超级电脑深蓝,这台电脑在经历首次挑战失败后,于1997年打败了当时的国际象棋冠军,名噪一时。第一次引发了人们对于未来人 工智能技术的担忧。IBM并未停下脚步,随后开发了人工智能计算机系统沃森(Watson)。它在2011年参加了美国的电视智力节目,并打平了两位人工对手。沃森的处理速度相当于每秒读完100万本书,而且并未联网,如此强大的知识储备远非人类所能比拟,它的问题主要在于对描述较少问题上的无 力。上个月沃森完成了对1900个TED公开课课程的学习,这些内容足以让一个人从生到死都学不完。

  美国一家软件公司Wolfram于2009年推出问答搜索引擎Wolfram Alpha(W | A)。这一搜索引擎不同于我们通常所用的谷歌与百度,W | A会直接给出问题的答案,作为一家数学软件公司,Wolfram Alpha能轻易回答各类数学问题,解答数学问题不必借助软件,直接在搜索中求解。而且W | A还可以回答物理化学乃至人文历史等方面的问题,比如询问现任美国总统夫人是谁、乔布斯的生卒日期,W | A均能直接给出答案,从而省去了在搜索结果中自己组织答案嗯过程。W | A强大的问答系统已经被苹果公司的Siri语音助手采用。

  在语音识别技术上,美国三家科技公司苹果、谷歌、微软都 在加紧布局,Siri、Google Now、Cortana三款智能语音助手已经成为各家操作系统的一大卖点。苹果Siri得益于布局早以及iOS设备较高的普及度,Google Now凭借谷歌十几年在搜索引擎上的深耕,微软Cortana则利用在PC操作系统上的霸主地位,三家各具优势,未来还将在该领域继续厮杀。

  同时,谷歌、微软、Facebook等公司在图像识别领域也开始发力。以图搜图、识别图像内物品、人像识别都是图像识别的重要应用。而今年谷歌推出的 Photos应用打开了图像识别技术实用化的大门,Photos智能整理照片的功能初露端倪,未来图像识别的发展方向即代替人类进行繁复的整理审查工作。

  总之,与日本企业不同,自计算机技术革命以来,美国一直在软件领域处于领先地位。

  在家用机器人硬件还无法进入寻常百姓家的情况下,美国企业首先在软件方面发力,依托于互联网上的云计算技术和手机、PC等现有移动设备,将机器人引入生活。这条道路显然比日本要好走得多。

  中国暂露头角

  3.jpg

  讯飞语音

  相比日本企业对机器人的钟情,在中国国内,由于技术积累的劣势,人形机器人落后于美日等国家,仍然主要处于高校研究的阶段。

  目前,哈工大、清华、上海交大等高校的机器人研究在国内颇具名气。企业方面,如新松等知名机器人公司还是以提供工业生产为主,尚未有人形的民用级产品问世。

  在软件方面,中国科技企业与西方国家的差距并没有硬件那么大,诸多实用化的人工智能产品已经问世。其中,最大的中文搜索引擎百度近来在图像识别 方面奋起直追,招募了一些像吴恩达、余凯这样的人工智能专家。今年初百度也声称识别错误率上已经低于微软和谷歌。不过,本月ImageNet爆出百度-作 -弊-的丑闻,让原本公布的研究成果不可信,也为百度人工智能团队抹上了一层阴影。

  中国另一家科技公司科大讯飞无疑在中文语音识别上处于领先地位。借助智能机的发展,科大讯飞推出了手机上的语音输入法和语音助手。而在这之前,该公 司的文字转语音技术就曾在北京奥运会期间投入使用。相较于美国企业,本土企业在中文语音技术上具有民族情感与政策扶持的优势,已在中国的人工智能研究中率 先展露头角。

  结语

  4.jpg

  Pepper机器人

  日前,鸿海与软银、阿里巴巴合作推出的机器人Pepper有着明显的日系特征,1万元人民币的价格虽不算太贵,但和手中移动设备相比,并不具备价格优势,若和美国亚马逊推出的180美元智能音响Echo相比则劣势明显。而Echo也一样能做到语音识别和语音合成发声的功能。

  从亚洲文化来看,日本与中国企业的合作显然是要做出一款外形友善的智能机器人,它承载着更多情感的角色,而非呼之则来挥之即去的助手。我们对Pepper也不必期望过高,毕竟它只是第一代产品。况且1万美金的价格和试水的发售量,也让我们对它背后的技术支持产生怀疑。

  Pepper的推出是亚洲地区的企业在机器人领域的一次成功尝试,但若要在这个领域有更大作为,日企、台企和大陆企业还应该在软件上奋起直追,而不是把机器人做成徒有其表的玩具。

分享到:
收藏
相关阅读