机器在本质上是人类器官的衍生,让我们看的更远,听的更多,所有想要的信息信全部手拈来,而图片识别相当于千里眼,让我们可以通过图片搜索到一切自己想要的信息,而在未来图像识别将会出现以下场景。
1,识别人脸情绪,人类对于他 人脸部的表情十分敏锐,都能够十分准确的从他人脸上读出情绪,这是由于原始人的时候我们需要生存所致,一直延续到了今天。而机器对于人类面部表情的识别也 将衍生到情绪,机器可以通过读出一个人的情绪进而做出各种判断,为其他决策提供支持。这将非常有利于犯罪案件的侦破,以及获得用户对产品的真正反馈等等。
2,识别同一张脸,百度魔图推出过明星脸相似度功能,用户通过上传自己照片,来找出与自己相像的明星,该功能也持续了很长一段火爆时间。而这只是图片识别的初步试水,未来识别同一张脸将会得到真正广泛的应用,犯罪侦破,身份绑定,人脸支付,都是新一轮重要的场景。
3,图文识别,将拍摄到的文字识别出来。在这点上百度已经拥有相当成熟的OCR技术,能够非常好的将图片文字信息转化为字符格式。当这种技术更为后,图书就可以进行更好的数字化,进行更方便的无纸化办公将各类重要纸质文件进行更安全的数字化保存,我们在外旅行时也可以通过拍摄相应的国外文字来直接向百度寻找答案等等。
4,物品识别,将拍摄到的物品识别出来,告诉我们这是什么。这个需求目前在服装领域需求最为旺盛,阿里方面也在加速对图像识别的技术研究。当用户在线下看见某件衣服好看,就可以直接通过拍照并在网上下单购买,这是一个相当有前景的未来。二维码只是过渡,未来万物联网才是关键。
二,语音识别的未来
李彦宏在2014年说过未来五年语音图片搜索会超过文字,而语音搜索目前已经显出态势,根据百度2015趋势报告“00”后提供了34%的语音图片搜索请求,大势已经露出端倪。而语音就目前来说发展的远比图片识别成熟,我们看一下未来语音的场景。
1,语音识别,语音识别是基础中的基础,我们说了一段话后,机器将该语音翻译为文字。从前在PC端搜索我们需要双手,但是手机则完全释放了双手,取而代之的是手指和语音,而当语音越做越好时就能越来越多的取代原来手指做的事情,所以BAT都在全力押注语音识别。
2,语音命令,在我们这代互联网人看来用手指与机器交互是理所当然的事情,但未来的情况也许并非如此,当前“00”后已经越来越习惯语音搜索,试想当语音搜索的便携超过手指时,我们注定会进入语音命令时代,我们对电脑下达命令的方式是通过语言而不再是手指,这也是李彦宏再次提前申请轮番查询的专利的原因。
在未来,当你只需要对着手机说“八点钟我要洗澡”,机器就会自动在八点之前帮你把热水烧好。而这只是场景之一,未来将会有更多无穷的组合可能性,所以语音智能领域是极为重要的。
三,机器预测的未来
机器预测就是通过收集用户大量的行为,然后根据这些数据再反过来为用户决策提供各种依据。
马云说我们正在从IT时代过渡到DT时代,而如何利用这些数据,正是我们要去思考的。BAT都在数据挖掘领域不惜花大代价,而百度投入是最多的。未来我们的一切行为都将被信息化,智能家居进军,我们的衣食住行统统被联网,无所不包,而如何利用这些用户的行为数据去创造价值,则是整个互联网行业未来需要考虑的。