中国数字家电网

广告赞助

冰箱推荐阅读

主页 > 冰箱 > INTRODUCE

专访云知声CEO黄伟:如何打造人工智能「云端芯」生态闭环

2016-06-10 18:02 作者:中国数字家电网 来源:互联网 浏览: 我要评论 (条) 字号:

摘要:专访云知声CEO黄伟:如何打造人工智能「云端芯」生态闭环-新闻频道-和讯网

大副克拉兹 军人光辉之血刃 大地游龙传 爱你爱到死心踏地 星辰变后传5200 江南海盗基地 恋爱前规则演员表 纨绔仙医顶点 改造黑道总裁 9oal玉足 石狮祥记老板娘 色清尘不染

云知声 CEO 黄伟

云知声 CEO 黄伟

  一、云知声的技术研究

  2012年底,我们把深度学习应用到了语音识别。我们今天的技术架构都在使用增强学习。

  机器之心:这几年深度学习带来了语音识别的巨大进步,云知声是何时开始这方面研究的?

  黄 伟:2012 年 12 月底,我们把深度学习应用到了语音识别里,而且把它开放出来提供给第三方。这源于 2011 年,我去佛罗伦萨参加国际语音会议 Interspeech,当时和微软研究员俞栋就深度学习的交流给了我很大信心,后来,云知声在 2012 年 6 月份成立,9 月份我们发布语音识别平台,之后紧跟着 10 月份我们就开始做深度学习。

  那 时,几乎很少有创业公司敢于尝试这个领域,而且我们当时的资源也很匮乏,我们自己用了一个普通的服务器,然后又买了几块 GeForce 显卡,其实我们很早就开始用 GPU 了。2012 年年底,我们的深度学习系统将当时的识别准确率从 85% 提升到了 91% 。随后在 2013 年 2 月份,我们做了微信上的第一个语音输入插件,由于我们使用深度学习带来了准确率的明显提升,所以这款插件的用户体验非常好。

  虽 然我们很早把深度学习用于语音识别,但其实只是一个起步,当时公司刚刚成立几个月,不可能积累很多数据,所以当时我们的训练数据只有 800 小时,后来随着我们不断增加训练数据,今天我们的识别准确率已经能达到 97% ,属于业内一流水平,在噪音和口音等情况下性能也比以前更好。

  机器之心:云知声近期主要在做哪方面的研究?比如说自然语言处理方面?

  黄 伟:我们还是有些超前意识的,今年 1 月份,就在 AlphaGo 火爆之前,我们就成立了 AI Lab,为什么可以做?首先,2012 年我们开始做深度学习,今天我们人工智能所有的应用层面,图像识别、人脸识别、语音识别、机器翻译和语音合成,所有的技术框架都基于深度学习,只是数字信 号不一样而已。所以对我们来说,我们要从语音拓展到其他领域没有任何问题,但只是说我们现在要意识到人工智能是未来,现在我们要做这样的布局,这种布局不 光是指你意识方面的改变,同时围绕这个目标你还要做人才储备和资源投入。从这方面来说,从去年开始我们一直对研发投入非常重视,每年在研发上的投入占到了 50% ,今年我们的研发投入预算和去年比超过了3倍。今年公司规模和团队规模也在扩大,我们还会在硅谷设立办公室,同时还会在一些新的技术方向进行储备和投入。

  关 于自然语言处理,我们在 2013 年 9 月份就发布了语义云平台,到目前为止我们在语言理解方面支持的领域超过 50 个,从 2013 年开始我们就在做这个事情。包括给乐视及其他厂商提供的解决方案里,都会包含信号处理的降噪部分、语音识别部分、语言理解部分、用于用户反馈的语音合成部 分、以及用户画像和声纹识别等,我们提供的是完整的解决方案。

  只 是说,今天的语言理解我们还需要做的更好一些,比如以前做一些简单对话,那后面你会做一些复杂对话或者多种对话,这个需要我们不断投入。从技术来看,我们 在语言理解方面,以及我们今天的技术架构都在使用增强学习。因为我们平台每天会产生大量数据,我们会对这些历史数据进行总结。但增强学习可以对未来数据进 行预测。对于一个人工智能系统,你不能总是等犯错之后再去纠正。从这个角度来讲,增强学习是对未来一种行为的预测。这大大提升了我们对数据的利用效率。

  二、云知声的发展模式和产品思路

  未来一切智能都是从芯片开始的,芯片的智能化一定是通过云端实现的,云端智能渗透到用户里也一定是通过芯片实现。

  机器之心:云知声自一开始就坚持平台策略,这种发展模式背后主要有哪些思考?

  黄伟:我们是做公司,而非研究院,所以说技术指标只是 KPI 之一,我们还需要一些商业模式和产品模式的探索。

  我 们早在 2013 年就确定了平台战略,因为我认为人工智能的前提是感知智能,你一定要先完成数据的感知,那我们的平台就是一种最好的收集数据的方式。当年 App 大行其道,我需要非常费力的去给很多投资机构解释为什么我要做平台,而不是 App 。原因在于:1)用语音识别技术去做 App 意味着我要有 80% 甚至更多时间精力放在和产品有关的事情上,但任何一个公司在初创期精力都是有限的,你不可能同时有研究院、工程院,还有产品部门。2)做 App 之前要明确语音在手机上是不是刚性需求?其实直到今天,我本人也都依然对此持怀疑态度,我认为手机是以触碰为主,语音为辅的。3)我们认为平台战略的 B2B2C 方式是一种最快到达用户的方式,既然语音在手机端不是刚性需求,那你不要指望它有多少自然下载量和活跃用户,更不能指望它给你贡献多少有用数据。但 B2B2C 这个方式就可以帮你和应用场景结合,产品由你的合作方来做,用户由产品渠道来获取。这样的话,你就可以尽快的把用户规模和基数扩大。

  在采取了平台战略后,我们的发展非常快,2013 年时已经积累了接近 10,000 家合作伙伴,和搜狗、乐视、华为等国内众多知名公司建立了合作关系。如果不是靠平台而是自己做 App 的话,我们是不可能达到这样一个量级的。

  机器之心:云知声的产品思路是怎样的?是如何提出「云端芯」产品战略的?

  黄伟:上面讲的是云知声关于未来发展模式的探索,在产品方面我们也一直在思考。最近你会发现,包括出门问问的李志飞、Face++的印奇等,这些做了3-4年公司以上的创始人都不会再过分强调技术了。所以我要讲的是,公司怎样在产品方面找到一个适合自己的通道。

  其 实我们在 2013-2014 年往外走时发现了一些问题。首先,并不是所有用户的场景都是联网的,联网不能解决所有问题;其次,SDK 的粘性比较弱,用户的切换成本较低。也无法为用户提供一种非常好的体验,因为软件能实现的功能毕竟是有限的,它可以模拟,但有时候必须要用硬件,甚至芯片 级的去支持,软件是做不到的。基于这个问题,我们在 2014 年开始思考,未来的语音智能,甚至是人工智能是从哪儿开始的,以前我们的想法是把它放在云端,用户的数据回传然后在云端进行识别,麦克风和传感器等都是用 户的,但后来发现这中间是很容易割裂的。所以,经过这样的思考我们认为,未来一切的智能其实都是从芯片端开始的,芯片的智能化一定是通过云端实现的,云端 智能渗透到用户里也一定是通过芯片实现。芯片既像一个耳朵(收集信息)同时也承担了大脑的一部分功能。如果我们用 CPU 来模拟大脑功能的话,那我觉得大脑一定是由不同功能的 CPU 组合在一起的。从这个角度来讲,那人工智能也应该留在某种芯片上面实现一部分智能,这个芯片既像传感器(Camera和麦克风等),同时它也是大脑的一部 分。

  这就是我们在 2014 年上半年确定的事情,在业内最早提出了云端芯的产品战略,云是智能,端是交互,芯片就是传感器和一部分智能。

(责任编辑:admin)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
◎最新评论
      谈谈您对该文章的看
      表  情:
      评论内容:
      点击我更换图片
      * 请注意用语文明且合法,谢谢合作 审核后才会显示! Ctrl+回车 可以直接发表