手机在AI时代将如何给人类一个酷炫的未来,IDC和旷视科技日前已经给出了答案。
10月19日,这两家公司联合发布了一本关于AI与手机行业未来的白皮书《AI+手机“视”界革命》。
我们可以从中看到一个重要的趋势:计算机视觉技术将成为手机的最重要的底层技术,它将成为改变手机行业的支点!
所谓计算机视觉技术,是一个使计算机模拟人类视觉的过程,具有感受环境的能力和人类视觉功能的技术。它是图像处理、人工智能和模式识别等技术的综合结果。
同时,计算机视觉技术也是一门涉及人工智能、神经生物学、心理物理学、计算机科学、图像处理、模式识别等诸多领域的交叉学科——机器视觉主要用计算机来模拟人的视觉功能,从客观事物的图像中提取信息,进行处理并加以理解,最终用于实际检测、测量和控制。机器视觉技术最大的特点是速度快、信息量大、功能多。
这份报告的参与方旷视科技(Face++),是全球十大突破科技——人脸识别支付技术的主导者,正是这一领域的领先企业,据杨姐所知,该公司已经推出了多套相关领域的解决方案。
而由IDC和旷视科技此次共同发布的报告对基于计算机视觉技术的AI和手机行业的未来进行了透彻全面的描述,未来的手机生活是一场计算机视觉技术的想象盛宴。
AI时代的新玩法
白皮书中称,IDC对中国年上半年出货量前名的手机型号(占中国上半年智能机出货量的91%),共计1.6亿部手机进行分类统计,其中提供AI功能的手机占比已经接近90%,但是真正具备全部AI能力的手机还不足10%,“AI手机”市场还有非常大的提升空间。
未来物联网时代,人们生活的方方面面,都要使用手机,而手机在各种应用场景,都会调用AI的计算机视觉能力。而计算机视觉则是AI的基础技术应用。
让我们看看目前AI技术在手机应用中的渗透率:
图1:AI技术在手机应用中的渗透率(图片来源:AI与手机行业白皮书)
从图1中我们可以看出,视觉应用是手机AI应用中最主要的诉求,可以说,提升视觉技术是当前手机厂商改善用户体验最直接和最有效的手段。
显然,这对于同质化严重的手机行业非常重要:你能骁龙芯片我也能骁龙芯片,你能四重安全我就能五重安全,你能钛金属外壳我就镭射外壳……手机厂商新机亮点匮乏,功能陈旧,爆款应用有限。
但如果手机厂商能够将机器视觉技术与手机APP功能相结合,则可能制造出引人入胜的卖点。
从报告中我们可以了解到,计算机视觉技术在手机的应用主要可以分为三大方向:识别与认证、AI摄影、3D视觉。
首先,识别与认证是手机视觉技术最基础的应用。
通过高效的人脸识别算法,手机可以实现毫秒级的人脸解锁和金融级的人脸支付,配合最新的3D光学器件可以进一步提高人脸识别的准确性和抗伪造能力,真正实现解放双手。
此外,通过深度学习技术,将用户照片(或图像)与第三方权威底图照片在云端进行1:1比对,精准判断用户的真实性,通过人脸识别和活体检测等算法,可以有效鉴别照片、视频、模型等欺骗行为。
00:19注:你拿张图片来冒充,是骗不了人脸识别滴
这类技术目前已经广泛应用于互联网金融风控、共享出行司机和乘客验证、社保、税务等行业,帮助甄别欺诈行为。
其次,人们最熟悉的手机应用——AI摄影。
今天的AI已经可以智能分析出用户的年龄、肤色、体型等特性,通过人脸检测、关键点检测、场景识别等AI算法,对画质进行精准提升。
其实,随着光学器件的升级,摄影摄像已经进入3D时代,通过深度镜头将人像立体还原,AI技术可以更精确的分辨出人物与背景,同时还可以添加3D人像光效。
第三,3D视觉是手机视觉技术最具潜力的应用。
这一技术被IDC和旷视科技最为看好——随着光学器件的提升,3D视觉将原来平面的数字世界做到立体,将真实世界完整地呈现在用户面前,用更逼真、更生动的方式感知万物。
IDC甚至在报告中认为,“3D视觉将实现计算机视觉在手机领域的重大突破,为手机应用打开更为广阔的空间!”
例如:AR游戏、虚拟试穿等应用,未来3D能为“AI手机”带来更多的想象空间。
这一技术最好玩、最可能广泛商业化的场景就是远程购物试穿——杨姐以前也曾经写过,京东已经开发出相应的虚拟试衣软件,他们一方面是想解决线上购买挑选衣服的问题,另一方面,京东也计划将这套系统应用于线下。
是的,3D人像在线下的应用场景中,可以让人们通过虚拟试衣系统,创造完全镜像化的身材、脸型及发型,方便快速地尝试不同穿搭,甚至自由试穿店内上百件的服装,迅速选择适合自己的款式以及搭配策略。
图2,计算机视觉应用全景图(图片来源:AI与手机行业白皮书)
而当IDC的报告中出现应用、解决方案等等的时候,就不得不特别提一下旷视科技了。
应用场景大爆炸
如果杨姐没记错,旷视科技早就推出了移动端的解决方案,那是一套包含了人脸解锁及支付、单反级成像、可以满足不同手机厂商在图像增强、相机增强、智能图像和视频处理上的需求的解决方案。
而其核心技术其实是旷视科技自主研发的“移动端卷积神经网络ShuffleNet”。
这个词可能有点太技术,我尽量解释得简单:这是一种专门应用于移动端的技术,它与行业中越来越大、越来越重的神经网络不同,ShuffleNet是一种专为计算能力有限的移动设备而设计的卷积神经网络,在相同精度下实际运行速度可以提升15-20倍,可以帮助手机厂商在相同甚至更高的精度条件下保持更快的运行速度。
它的应用场景可以是人脸解锁、人脸支付、影像处理以及智能相册——很多手机厂商已经应用了这套解决方案,例如OPPOFindX、vivoX21、小米Note3以及荣耀V10等。
图3,计算机视觉应用细分全景图。注:该技术并不仅仅是人们熟悉的人脸识别,更多的还有物体识别等多场景、多领域的应用(图片来源:AI与手机行业白皮书)
不过,杨姐有耳闻,旷视科技在自有的深度学习引擎和基础数据架构之上,还在围绕分类、检测和分割等图像识别的核心问题,以及云端、移动端、芯片等不同平台的深度学习模型实现算法创新。
毫无疑问,AI将成为消费者选择手机的必要因素。
而AI对于智能手机的价值,肯定也不仅仅是增加几个好玩的小功能。它更应该能够提前预测用户需求,主动给出相应指引或回应,实现真正的“从Smart到Intelligent”。
当然,这也依赖于技术的进一步发展,例如机器视觉技术与芯片的深入融合。
假设一下,如果像IDC报告中所提及的那样——让计算机视觉中一些特定的图像算法通过芯片的方式实现,并融入基于神经网络的深度学习,实现数据和计算的并行处理,那么将可能突破给定计算量设备上的带宽限制和算力限制,优化逻辑运算。
与此同时,深度学习的成功应用也将有可能倒逼神经网络的升级,使网络设计日趋完善,并进一步优化视觉分析过程,全面提升数据分析结果的质量。
按照IDC这份报告中的观点,3D视觉将成为计算机视觉领域的核心应用。随着光学器件的不断进步,算法与解决方案层不断优化,3D深度视觉的精度和实用性得到大幅提升,3D应用将为用户带来颠覆性的人机交互体验——年,IDC已经观察到3D摄像头被越来越多被主流手机厂商所有采用,新的3D视觉时代已经开启。
我们是不是可以合理推测一下:AI与手机结合的空间将越来越大,届时手机上的玩法应该会迎来一个大爆炸时期!
杨姐点评:
咱们刚才已经举例了很多场景,但其实最令人期待的除了这些刷脸购物、畅通无阻的门禁……之外,更具吸引力的是机器视觉技术在游戏中的应用。
例如,在手机游戏里玩各种cosplay——游戏中的角色就是自己。
大家还记得美国大导演斯蒂尔伯格的《头号玩家》么——人们完全生活在两个世界里,甚至虚拟世界里的生活更具诱惑力。
未来的手机,既可以是遥控器,也可以是游戏的周边——枪、手榴弹、弹夹,或许也可以是方向盘……
到了那个时候或许结合了3D虚拟技术和3D感知技术的手机,将成为更多游戏的载体。
我们是小白,但我们不是菜鸟!
荣获年最佳自媒体
媒体训练营最佳自媒体
百度知道认证专家
媒体训练营年度媒体之星
年度媒体训练营媒体之星
自媒体意见领袖峰会自媒体中流砥柱奖
TMT行业“领秀榜”年度优秀自媒体人
您可以在百度百家、今日头条、QQ公众账号、腾讯新闻客户端、网易新闻客户端、网易云阅读、雪球、百度号……等11个平台同时阅读