俞志晨:图灵机器人是智能大脑

  • 投稿wine
  • 更新时间2015-09-29
  • 阅读量204次
  • 评分4
  • 92
  • 0

文/姜姝姝

姜姝姝 本刊副总编辑

他是85后,也是国内最知名的智能机器人平台的创始人兼CEO。他是公认的阿兰·图灵粉丝,他为自己创业的机器人引擎命名为“图灵机器人”。他的期望是在未来,每个机器人都有一个聪明的智能大脑,每个人都能拥有自己的个性化机器人。

俞志晨,刚过完了30岁的生日,正式步入而立之年。“今年生日跟机器人一起过,有意思,而且赶上公司今天搬新家,太赞了。”在生日当天,俞志晨在朋友圈记录了这样一段文字,同时还上传了他和著名的NAO机器人一起吹蜡烛的照片。

对于大多数关注机器人的人来说,与俞志晨一起出镜的法国知名人形机器人NAO并不陌生,它是全球人形机器人的代表,全身具备数十个传感器及自由度,能够做出跳舞、单腿站立等高难度动作。有着Q的外形,讨人喜欢的同时,还具备一定程度的人工智能和一定程度的情感智商并能够和人亲切的互动。

在国内,该机器人因为接入了“图灵机器人”大脑,用户可以通过中文语言的方式与NAO机器人直接互动,而接入了智能大脑的NAO机器人却能够准确的理解中文语音指令并做出相应动作。有了“中国大脑”的机器人NAO也经常出入各大展会和活动场所,成为新一代机器人的代表之一。从某种程度上来说,“图灵机器人”因为和NAO的合作火了,俞志晨这个85后的创业者也频繁出现在媒体面前。但有不少人更倾向于这样点评:“这个年轻的AI(人工智能)团队做出的创业产品不火才怪”。

俞志晨虽然年轻,但他的经历已经牢牢打上了AI的标签。大学时,他就师从于人工智能专家贺仲雄教授,对人工智能领域充满痴迷;和他一起创业的小伙伴郭家是他大学里志同道合的好友,他们一同学习了AI课程。从北京交通大学毕业后,两人又一同在AI领域工作。2009年开始,俞志晨和郭家开始商量自己创业,随后叫上几个好友,一起创办了北京光年无限科技有限公司。

第一个创业项目的切入点准确来说是移动互联网和AI的结合,俞志晨那时发现,人们通过手机去获取信息和服务还不是很方便,很多时候需要手写输入,而很多程序的启动也很繁琐。“我们当时就在想有没有更好的方式能够让客户以最简单的方式来获得信息和服务。比如,我们只需对着手机说一句话:‘订一张明天上午去广州的机票’,它就能直接把结果反馈过来,节省掉中间过程。围绕这个初衷,我们做了一款APP叫虫洞语音助手,早期定位其实是获取信息和服务的一个工具。”

从智能语音产品开始

一直以来,语音类的技术都属于“高精尖”,虫洞语音助手这个产品现在看来也仍然是一个非常理想化的产品,它基本上融合了世界上最难的几个技术,包括语音识别、语音合成、语意理解等等,其中的每一个环节都很难突破,所以这个领域的技术攻克无论对巨头公司还是创业团队的挑战性都是一样巨大。

“并不是有钱就可以做好,包括苹果推出的Siri也并不理想。”俞志晨回忆着,虫洞语音助手算是做得比较早的产品,2012年产品就面世了,正赶上苹果推出Siri,那个时候国内能做的只有俞志晨团队一家,而百度、搜狗这些巨头公司差不多到2012年底或2013年初的时候才跟上这类项目的进度。

对于创业者来说,最重要的事情就是,有正确的想法,同时还要有正确的时机,Siri从第一个原型到第一个商业化版本花了17年的时间。如果之前推出来,可能语音识别技术也还没成熟,用户也很难接受;但是当iPhone推出来的时候,Siri的创始人就知道时机到了。而虫洞语音助手的推出也正是踩准了点,再加上虫洞在语音和问答系统这一块做得确实比较好,有一定的技术优势和大数据积累。所以产品推出来之后,虫洞语音助手在整个2012年的市场都很火,俞志晨团队不仅拿了第一笔天使投资,包括一些大的厂商也来找他们做合作内置。

当然,创业前期是非常艰苦的,在没有拿到投资之前,因为俞志晨是85后,毕业后工作的时间并不长,早期的几个创业者也情况类似,有一个共同的特点是——都没有钱。“那时候,他们每天除了睡觉、吃饭都在开发程序,5年用坏了五六个鼠标,淘汰了三台电脑,想了上百条创业点子,向投资方发出过几百封邮件,看了数不清的学术论文。半夜工作的时候,蟑螂、老鼠满地爬,就是这样挺过来的。”

语音助手和机器人是两码事

虽然在2013年底的时候,虫洞语音助手的用户数以及使用量都很惊人,装机用户超过4000多万,但是很多人已经开始察觉到类似Siri这样的产品其实还不够成熟,俞志晨此时也思考了很多关于未来发展的问题,他清楚意识到语音助手和人工智能、机器人还是很不一样的。

他认为,Siri以及虫洞语音助手的推出其实是开了一个头,之后的智能交互技术和产品将扩展到更多领域,包括智能家居、电视、车载等方面,而作为重要分支的语音智能也将朝着不同的方面去拓展和延伸。

在俞志晨看来,第一个延伸的方向就是语音搜索。百度、搜狗,包括谷歌在做这个产品的时候,更多是把语音识别当成是一种输入法,是一种文字转换的工具,本质还是搜索。只是把“我饿了”这句话,变成“我饿了”三个字,然后去搜索框里搜一下,是语音搜索这么一种形态。另外一个方向像微软的小冰,可以对话。俞志晨也开始思考按照虚拟化的机器人方式去做一个更深度的产品。“比如说,在百度里面说‘滚蛋’,它会给你搜出来一堆网页列表。但你在我们产品里面说‘滚蛋’,他就会回答你说:‘那我滚了’。它是在跟人互动,跟百度、搜狗的定位是不一样的。我们要做一个虚拟的人工智能的‘小伙伴’,我们希望这个机器人可以像一个人一样跟你能够互动和交流,这才能叫‘智能交互’。”

确定好方向,俞志晨和团队在2014年年初就开始转向机器人,半年之后产品发布的时候,正赶上机器人的发展热潮,而这个名叫图灵的机器人也很快被业界熟知。

阿兰·图灵是世界上第一个把计算机实际用于数学研究的科学家,也是第一个提出利用机器实现逻辑代码的执行,以模拟人类的各种计算和逻辑思维过程的科学家。这是后来设计实用计算机的思路来源,成为当今各种计算机设备的理论基石。所以,俞志晨将自己的心血命名为图灵,在一定意义上是为了纪念这位大师和偶像。

图灵机器人火了

“今天智能机器人的产业形态,跟30年之前PC产业的形态非常相似。今天无论是标准还是产品,包括用户体验,很多事情都是一个非常初级的阶段。图灵机器人的理念或使命,是希望给机器人装一个聪明的人工智能大脑,可以让这个机器人非常聪明。”俞志晨认为,图灵机器人的发布正好赶上了产业发展的春天,事实上,无论是虫洞语音助手还是图灵机器人,俞志晨对行业发展的判断一直比较准确,过程总体也都比较顺利。

什么是图灵机器人?俞志晨介绍,图灵机器人目前是中文语境下智能度最高的机器人大脑,也是全球领先的中文语言识别与计算平台。它对中文语义的理解准确率高达90%,可为智能化软硬件产品提供中文语义分析、自然语言对话、深度问答等人工智能技术服务。现在,图灵机器人已为家用服务机器人、智能家居控制系统、智能车载系统、智能玩具、智能客服系统等软硬件场景的超6万家合作方提供技术支持。通过图灵机器人官方网站,企业及个人开发者可轻松为自己的软硬件产品接入图灵机器人,而且图灵机器人API端口调用次数完全免费,每个人都可以通过图灵机器人官网创建专属于自己的智能机器人产品。

和同样是研究智能语音的科大讯飞相比,讯飞是国内领先的语音识别与朗读技术提供商,图灵机器人是国内智能度最高的机器人大脑技术提供商,两者在各自领域均处于领导地位。讯飞语音主要的技术积累在于“将声音转换成文字”,类似于人的耳朵,而图灵机器人多年的研究均集中于“对语言文字意思的分析与解读”,并在准确解读后反馈正确的指令,在智能语音交互中扮演着“大脑”的角色。就像是3岁的儿童听力一切正常,但是却“听不懂”父母较为复杂的一些话语一样,主要原因则是其智力与脑部发育处于较为初级的水平,无法准确识别复杂指令并做出相应动作,而智力发育正常的成年人,则能够在与人的交流中不仅听得懂语言表面的意思,还能够准确理解讲话者语言背后的真正意图。讯飞语音要为软硬件产品加上“听力正常”的耳朵,而图灵机器人则要为软硬件产品增添“智慧超群”的大脑。

俞志晨更多地想把图灵机器人做成一套在人工智能领域的操作系统,把技术提供给各个领域的开发者,做免费平台,一方面可以最大程度的降低个人开发者创业成本及企业级合作方的接入成本;另一方面,希望通过开放的方式与企业、开发者一起,推动人工智能技术在生活场景中的应用,推动人工智能行业发展。

根据俞志晨的介绍,图灵机器人的功能主要有三种:一是聊天知识库,同小冰类似,这项功能的主要用途是陪用户聊天;二是问答,和之前的虫洞语音助手类似,涵盖衣食住行、吃喝玩乐等生活服务信息的问答系统,让图灵机器人还可以扮演一个生活百事通的角色;三是知识库,图灵的知识库分为基础知识库和自定义知识库,基础知识库即图灵的自有知识库,除此之外,图灵还支持第三方自建知识库,来符合产品的革新需求。

图灵机器人有6万家合作方

人工智能的场景化应用图灵机器人究竟能用来做什么?俞志晨称这也是他们团队反复问自己的一个问题。从过去内测半年的情况来看,在接近1.5万名接入的开发者中,应用的主要领域可以分为以下几类:

一类是语音助手,除了我们常见的通用型语音助手,俞志晨提到还有很多垂直行业在使用这种语音助手的功能,比如旅游、购物这种应用场景较为明显的行业。

另一类是智能客服,这类功能的使用者主要是中小型卖家,可以通过自定义知识库来创建一个自己的智能客服来解决一些基础问题,也能相对降低人工客服的成本。

还有一类是虚拟伴侣,比如在虚拟眼镜里,图灵可以以虚拟伴侣的形象出现,在文字交互的基础上增加语音交互;相似的场景还可以应用到智能硬件上,来增加硬件交互能力。

再有一类应用场景是图灵团队之前也没想到的,即虚拟宠物。俞志晨提到在图灵的平台上会有一些年轻的开发者在班级的QQ 群里把语音助手的功能做成QQ宠物,以及居然还有人用这种方式赚到了钱。

语音助手在上面这些场景化的应用情况让俞志晨和团队逐渐想通了图灵的用途:在日常生活中,用机器的方式去取代那些繁琐的、重复性的工作。比如之后的保姆、陪护、客服、玩具、甚至安防等领域,都可以通过机器人的大规模使用来节省人工成本。

图灵机器人目前已累计超6万家合作方,涵盖软硬件领域下的数十个场景。涵盖软硬件领域数十个场景。例如,车载系统接入图灵机器人大脑后,司机朋友便可通过全语音的方式控制车载系统拨打电话、回复短信、开启导航、了解车况等,极大降低司机朋友因开车操作导航、手机等事故的发生率,同时提升司机朋友驾驶体验;接入了图灵机器人的智能玩具,则能够华丽变身为“儿童陪伴机器人”,孩子可以通过自然语言的方式与玩具对话交流,同时,具备机器学习能力的机器人的智力也将随着孩子智力的提升不断提升;接入了图灵机器人的客服系统,将完全抛弃“教育期刊网 http://www.jyqkw.com
关键词 对应”这种陈旧的方式,为用户提供更智能、更具人情味的体验……基于强大的中文语义分析及自然流畅的中文对话能力,图灵机器人可被应用于多种个性化场景以满足个性化需求。

目前,海尔的智能家居中控系统、三星智能电视、HTC手机中的Hidi语音助手、博世车载,以及全球著名的人形机器人NAO都与图灵机器人深度合作。除此之外,图灵机器人还与近百家的家用服务机器人服务商签订了长期的战略合作协议,致力于推动家用服务机器人行业的发展,为智能家居安装上“图灵大脑”。

人人都有机器人

最近日本长崎县一家全机器人运作的酒店开业了:眼睛忽闪忽闪穿着制服的“美女”在前台迎接你的到来,穿着侍从衣服的“恐龙”会告诉你如何登记入住,机器人搬运工会帮你搬行李,而狗形无毛机器人则为你提供早餐服务。酒店管理方说,这并不是噱头,而是希望通过使用高科技提高工作效率并节省人力支出。他希望机器人能够承担酒店里90%原本需要人工完成的工作。

包括无人机以及无人汽车等,这都可以被称为“改善型需求”。不管是否愿意承认,一些基础的工作正在逐渐被机器人取代。俞志晨甚至认为,机器人会越来越减少对人的需要。“所有人都在做一件事情,就是让机器人跟人高度相仿,不管是在外观、动作和意识上,机器人会跟人越来越相似。”俞志晨说。在光年无限公司的办公室里,摆放着世界各地的硬件制造商生产的不同样貌、不同作用的机器人。他的身旁,就站立着一个九头身的日本制造的美女机器人,俞志晨说,有一天晚上自己在公司加班,还被这个“美女”吓过。他相信,未来10-15年,机器人和人会达到无限接近的状态。

目前,“图灵机器人”也正在开发硬件,即做属于“图灵机器人”自己的机器人外壳。未来,我们为什么需要机器人?俞志晨用手机和机器人做了一个比较,一个阳光明媚的下午,你躺在摇椅上,想听歌了,打开手机放音乐,手机只能静静地待在一旁;如果这时有个机器人,它不仅可以声情并茂地给你唱歌,还能伴舞,这不是更有意思?