摘要:在技术层面,它代表不同的维度。举个例子,我们讲语音识别的远场近场,可能手机和手表,可能大于30厘米的距离,实际上一般你的后视镜也好,你的距离可能都在这里,所以这个基本上也是1米的距离。但是,音箱现在大家
田中久一 黑帮高中豆瓣 黑道成王 黑木明纱快播 衡水热线欢迎你 洪荒第一仙 久久热 久久 侯龙涛 冯云 |
在技术层面,它代表不同的维度。举个例子,我们讲语音识别的远场近场,可能手机和手表,可能大于30厘米的距离,实际上一般你的后视镜也好,你的距离可能都在这里,所以这个基本上也是1米的距离。但是,音箱现在大家宣称最大是5米。这确实技术上是一个很有意思的场景,以前所有的语音识别收集数据都是离麦克风这么近或者更近,可能很少有人那么远的,而且需要远场唤醒,因为你不能手去弄它。 而今天最大的瓶颈就是自然语言的理解。我相信大家都有一个经验,当你去调戏SIRI或者是调戏各种音箱的时候,第一轮没什么问题,当你跟它进行一个对话,你把句式换一换,或者说你再特意调戏一下它,基本上两、三轮就把它问死了,它是答非所问,或者纯粹就是“呵呵”的那种。 亿邦动力网接触到的专家、从业者传递了这样的信息:作为一种产品形态,智能音箱不排除有昙花一现或者改弦更张的可能性,但这背后代表着真实而日益逼近的交互方式的变革,迎合了人类的对于简单、便捷的本性追求。 所以现在确实没有一个选手全都具备了,当然市场上确实可能有那么3-4家,每一个都有自己稍微比较强一点的地方,可能拿着这个点不停地打。 我觉得智能音箱这种形式要分软件和硬件两个层面来看。 2:使用空间比较私密。 只不过硬件的载体是什么?是单一的音箱还是两三个音箱,或者在各处有不同的设备? 在1956-2011年,即在Siri出现之前,可能更多是算法,主要是政府或者学术界在研究算法,把自然语言处理、计算机视觉、图像识别,各种各样算法的框架搭起来。 这样的不同在我们两地的音乐APP上就有了体现,我们以Spotify为例子,还有QQ音乐(用户量最大的中文音乐播放器),很大的不同: 由此还可以推出很多不一样的场景,大家可以去思考,这些场景所带来的用户需求一定是不同的。 从商业角度来说,大家生活空间不就家里、车里、路上、办公室,这基本上覆盖了每天的空间。 但是不管怎么样,尤其对我们这样的公司来说,我们还是把这个软件、交互AI作为最核心的东西。所以,市场硬件更多是我们的一个载体,我们找到一个大家能够接受的一种形式。 而且在家里有多轮对话,家里小孩可能喜欢对话,而且你们没有屏幕,可能没有别的方式。 有的人是说,有内容生态,有音乐、FM、相声各种东西,这个打内容; 10. 距离一款电影Her那样的产品有多远?科幻片电影《她》(Her)其中的“女主角”——一款虚拟个人助理产品,给大家带来了无尽的想象空间,但是李志飞强调,从技术实现的难度上看,它真的还只是科幻片。 3:语音交互可能是唯一的或者少有的一个好的交互方式。 我们在语音交互以及在语音交互硬件商落地做了很多尝试,包括手机、Googleglass、智能手表、车载、音箱、耳塞,我们发现,如果你要使语音交互有用,要具备几个条件: 5. 百箱大战竞争点在哪里?(李志飞)有的人拼性价比,硬件供应链能力比较强,打低价,把市场搞的很乱,或者说别人都没路可以走; 但是屏幕是跟电视绑定,还是自带,或者必要的时候把手机打开,这其实是一个可以值得探讨的问题。 留声机的发明,使得音乐第一次进入了家庭,我可以躺在家里面去欣赏音乐,是不是我付出的能量减少了? 很流行的设想是,智能音箱将控制整个家,难道真的只有这一个入口吗? 2、在北美消费者的厨房是开放式的,跟客厅融入一体的厨房,这也是亚马逊Echo最最常用的一个使用场景。而在我们身边,大家都知道,厨房为你完成的是煎、炒、烹、炸,这个场景是完全不一样的。 所以,家里肯定是一个非常重要的空间。 人机交互演进的方向很简单:使得交互成本的降低,即人完成交互所需要消耗的能量,或者说人完成交互所需要付出的成本。 这是现在亚马逊、Google都在思考的问题。可以就选小设备,在花盆里,无处不在,有很多的模组。 1、技术。 同时,中美两地的消费者消费的场景也有很大的不同,挑两个例子来跟大家分享。 条件二:使用的场景是比较私密的。智能手机现在在公共场合很难用语音交互的,但家里是一个比较私密的场景,自然用户可能愿意用语音进行交互。 (李志飞)从软件的角度来说,我认为入口是统一的。 在2011年的时候,Apple发布了Siri,这可能一下子激发了大家对语音助手的讨论或者期待。我相信,当时所有人买了一个iPhone拿回家,第一件事情可能就是调戏一下Siri,显示一下自己的智商比Siri要高,然后就再也不用了。确实,在过去很多时候都是这么一个场景。 但是,不管怎么样,大家确实看到了大众对于这种虚拟语音助手的热情。所以,后来无论是Google还是微软,还是Amazon,他们都发布了自己的虚拟助理,或者语音助手这样一个产品。 6. 有了语音,我们还需要屏幕吗?目前市场上主流的智能音箱不带有屏幕,依靠语音交互,据外媒报道,Facebook正在研发一款更加注重视觉画面交互的音箱,配置一块15英寸的触摸屏幕。 9. 智能音箱能在国内普及吗?宋少鹏认为,中美音乐欣赏以及家庭环境的差异,导致智能音箱在国内的发展路径不可能照搬美国的。 当然,音箱可以跟智能电视交互没什么问题,但是更多是以使用电视场景的时候,我通过音箱控制。而不是说我为了控制空调,我跟智能音箱说了一句话,智能音箱把电视打开,电视显示出一个什么样的结果,最后我看到什么东西,这个是不太现实的。 我认为单一的一个设备是很难承载所有的交互的,未来无论是交互的方式还是交互的设备,都会是多元化的。交互的方式除了语音、手势、图像、视觉、表情各种各样的方式可能都会是综合性的。语音可能比今天变得更重要一点,但是它绝对不会成为80%都靠语音交互方式。 电商资讯第一入口然而,是一个新的设备形态,可能就贴在面板上,放在花盆里、卧室的墙上,这种有一个特色,其实我们今天定义的屋里(远场语音交互)是不是有必要?因为可能房间有8个设备,我走到哪都有。 未来搜索,我们首先用PC、键盘到手机上,已经很多开始用语音,未来家里可能直接用对话进行搜索,所以肯定是入口的一个东西。 沿着这个思路一路迭代,到了iPod,我可以把1000首歌装在我的口袋,手指一滑,就可以欣赏我喜欢的音乐。能量的消耗就更少了。 3. 为什么音箱最先引爆热点?宋少鹏指出,智能音箱这样的产品形态最早在美国出现,这与当地的音乐消费习惯密切相关,极高的用户粘性使人工智能技术不用多完善就得以商用。 我反而相信,智能音箱可以上智能手机的屏幕,在有必要的时候,还是打开手机做一些操作,这可能是比较渐进式、现实的解决方案。 第一,从软件的角度来说,无论智能电视还是路由器、空调或者墙上的一个钟,成为一个入口设备,我觉得都比较类似。 音箱本来就是被动播放音乐的产品,人工智能和语音助手的植入使它成为一个主动获取信息、获取音乐,成为一个流量的入口。 8. 国内智能音箱的需求量大吗?(李志飞)首先,短时间内达到什么千万级别的量,很难。今年整个市场差不多能达到100万的出货量。 而现在可以看得到,智能音箱可能是继智能手机之后一个唯一超过一千万量的产品,有比较高频的人机交互产品。。 条件三:语音交互可能是你最好比较方便的形式,可能没有更好的方式,比如Googleglass就很难用别的方式。 首先,我认为,不会是唯一的设备,但我也不同意每一个设备都会有自己远场语音交互的能力。因为成本方面不合理,比如加50元或者100元给空调做远场语音交互,就为了控制开关温度,我觉得这是非常没有道理的事情。 因为虚拟个人助理或者是语音交互要得到使用,其实就是看你有什么样的场景,用户是调戏一下就走,还是说真正有活跃度。 这是历史发展过程中一些简单的产品,当然还有很多别的产品或技术,但这可能是大众关注比较多的。 同时,语音又是连接物联网的桥梁,家庭场景的价值将被更深挖掘,家居产品的制造、销售环节呗打散、重构,带来全新的品牌机会。 我认为最核心的是我们今天计算机没有对物理世界和常识有建模、理解。 这三个条件都很重要,Googleglass单独看DAU很高80%,但是这个硬件本身没有刚需,使得它的语音交互作为上面的一个软件也没有用。 如果我们把时间拨回到两百年以前,可以想象一下,热爱音乐的人去欣赏音乐,需要驾着马车,到音乐厅或者歌剧院,才能欣赏音乐。 (李志飞)从产品的角度,我一直觉得智能音箱这种100%靠语音交互的产品是很难做好的,一定得有一个屏幕的出现。 而在我们家里,通常都是壁挂式或者是落地式的空调,每一个空调都有单独的摇控器,这就决定了如果音箱作为一个智能家居的中控,它对于空调的接口、控制场景和体验是不同的。 包括内容消费,比如现在很多音乐、音频,这种内容可能未来都收费,这个是智能音箱可能是很重要的消费场景,所以也是一个内容的入口。 但是,确实Apple的用户教育能力是非常强的,所以在这之后基本上引起了整个虚拟个人助理的热潮。 所以我们认为,在中国做智能音箱,一定不能复制亚马逊Echo的路径,而是要找到我们真正消费者的需求,落实消费者的场景,来解决我们自己的问题。 从技术角度说,智能音箱是一个语音交互特别有意思的产品。 总结起来,我觉得这三点是语音交互能不能得到应用一个基本的判断: 我们当时看DAU(日活跃用户数量),比如手机语音交互的DAU小于1%;手表小于10%;车载大于60%,也就是100个用户有60个用户会用语音进行交互;Googleglass是80%,因为它没有别的交互方式。 2. 还有人工智能出门问问CEO李志飞认为,智能音箱是虚拟个人助理的一种存在形式,而后者则是人工智能技术在消费领域的应用。 在那之后,大家其实就看到了,Google也发布了音箱,中国已经,或者说正在进入“百箱大战”,最后谁能胜出?谁也不知道。 一个特别有意思的悖论,一方面计算机可以创造一个程序,可以打败世界上最牛的下棋的,无论是围棋还是象棋的棋手,表现计算机非常聪明。但是另外一方面,计算机都不能像一个5岁的小孩一样跟你进行一个正常的对话。 另外一个时间点我觉得比较关键,2014年Amazon发布智能音箱Echo。 我们认为这就是两地音乐消费的DNA根源上的不同。 (责任编辑:admin) |
谈谈您对该文章的看