AI视觉识别:梦想被280亿估值照进现实 9月初,朋友圈被Zao以迅雷不及掩耳盗铃之势占领。 一条条顶着自己头像和明星尬戏的视频,其背后的驱动技术是一项AI视觉技术:DeepFake。 Zao并非第一款因为AI视觉而火爆的APP,在Zao之前,FaceApp就已经爆红过,它能根据头像生成跨时间、跨性别的照片,且效果清晰,几可乱真。 与此同时,8月26日晚间,AI视觉企业旷视科技(D轮估值280亿)正式向港交所提交IPO招股说明书,开启了AI视觉独角兽冲向资本市场的新篇章。 安防,竞争并非来自内部 人类对虚拟现实的想象由来已久。 1973年,哲学家希拉里·普特南提出“缸中之脑”实验:假设一个狂人科学家将大脑从人体取出,放入一个装有营养液的缸里维持着生理活性,超级计算机通过神经末梢向大脑传递和原来一样的神经电信号,并对大脑发出的信号给予和平时一样的反馈,此大脑能否意识到自己活在虚幻之中? 如果说这个问题还离我们比较远的话,以人脸识别、虚拟成像为代表的AI视觉技术却已经很成熟。 2015年以来,国家持续出台利好政策,推动了AI视觉技术在金融、安防、医疗、智慧城市、公共安全、轨道交通、政府治理及交通等行业的应用,资本扎堆布局。这其中,依图科技、商汤科技、旷视科技、云从科技四家是代表性的企业,又被称为“AI视觉四小龙”。 目前AI视觉公认成熟的商业场景有三个:安防、金融和手机,这其中安防是传统的主战场,涉及万亿级别产业蛋糕,且靠近政府、银行等企业客户。 说得安防者得天下并不过分。 2014年,当时一家叫格灵深瞳的公司被投资人徐小平赞赏,原因是其研发出能够识别危险手势的智能设备,安装在ATM机旁,一旦发现危险就可以自动报警。新技术加上传统巨量市场,再伴随政府机构和银行客户安全的硬需求,看起来是一份可以快速商业化的巨大收入。 不过,这个产品最终没能规模化,因为格灵深瞳的产品是做智能摄像机,带3D景深,类似于AR、VR技术,但技术成熟度不够,并没到适合商用的阶段。一批AI视觉企业捕捉到了这个商机,用人脸识别实现相同的功能,而图像识别技术的成熟度是足够的。 即便如此,以算法见长的AI视觉公司要切入安防依然举步维艰,智能安防摄像头要依托于整套安防体系内才能发挥作用,但行业内已经有传统安防设备巨头,控制着大多数市场和供应商。 早先,这些安防传统巨头选择和AI视觉企业合作,按照所卖摄像机台数支付技术授权费。但后来,这些巨头决定转变模式,自己搞算法,独立开发图像识别技术。 他们迅速成立了自己的人工智能研发团队,为弥补智能算法上的人才短板,充实自身实力,同时给竞争对手釜底抽薪,甚至找猎头专门挖AI视觉企业的核心人员。 面对安防这个绝大的蛋糕,四小龙们已经不能再单单满足做背后的技术提供者了,如果想在这个领域长期扎根下去,无论正面硬刚传统安防企业的竞争,还是谋求建立更加稳固的合作关系,是短期内必须要做出的选择。 手机,等待打破固有格局者 众所周知,AI始终是创业的热门领域,但最后一环的商业化也一直是个难题,直到AI识别和手机产业相结合后,原有的天花板一下子被打开了,除了传统的安防、金融场景,AI视觉又多出一个可变现的应用。 目前世界上60%的摄像头被用在手机上,像苹果公司在AI识别上的专利收购和研发成本,已经达到近10亿美元,有分析称这个市场的收益未来不会少于金融领域。 旷视科技之前在做金融业务时,在FaceID和云上Face ID等实际应用场景上积累了很多经验和知识,于是很顺利地迁移到了手机上的人脸识别上。 二者之间又有细节上的不同,金融领域的刷脸应用,需要按银行要求摆动头、眨眼睛,但在手机端,用户不需要做这么多动作,绝大多数是正面识别;同时,手机对用户的体验要求非常高,如苹果手机人脸识别的误失率要求为百万分之一,这是AI视觉供应商必须达到的。再比如在金融应用上,人脸算法做到三、四百毫秒的延迟就很不错了,但手机的要求是延迟时间在100毫秒以内。 实际上,目前国产手机的人脸解锁功能,与最先进感知技术依然有差距,是一种折衷方案。当前国产手机主要还是用可见光和红外光感知人脸面部特征,可以理解为2D技术,这种方案不能达到区分活动的人脸与打印出来的照片的区别,因此不能应用于安全需求高的支付领域。 因此,竞争焦点在于谁能实现用户体验最优的3D结构光或者TOF测距技术。3D结构光,可以感知到人脸面部相互之间的距离,不再仅仅是二维平面图,这是目前四小龙们每天着力突破的难点。 目前的竞争格局,是不同厂商获得不同区域、品牌的人脸解锁业务,手机厂商也希望通过这种技术提供商的分摊,避免过度集中的风险,提高谈判筹码。未来随着某家企业掌握了3D结构光等升级技术,并获得技术积淀后的优势,不排除打破现有的格局,独占整个智能手机人脸识别市场。 求变,技术唯一,商用无限 在安防、手机领域之外,四小龙们也没有放松拓展其他领域商业化落地的机会。 在人脸识别上,由宜信财富私募股权母基金投资的依图科技多次在世界顶级人脸识别比赛中获得第一名,其人像识别比对系统可在0.5秒级内完成单张人像查询,并检索亿级数据库后返回精准结果,超越了人眼识别平均水平,在青奥会、珠海航展、G20峰会等活动上实际应用。 此外,其车辆识别系统能通过对车辆品牌、型号等精准识别,实现品牌识别、假套牌库分析、基于视觉特征的“以图搜车”,已经在多个省公安厅应用,并获公安部科学技术进步奖。 甚至在2018年12月,依图科技发布了一个“听写大赛”微信小程序,内嵌各语音识别引擎,由网友自行对比识别率。最终在所有场景下的语音识别,依图科技都遥遥领先。 值得一提的是,依图科技进军语音识别领域才刚刚一年的时间。 2019年5月9日,依图科技在上海召开发布会,宣布推出其首款视觉推理AI芯片产品QuestCore(求索),以及基于该芯片构建的软硬件一体化系列产品和行业解决方案。 依图的产品距离民生是非常近的,现在去出入境管理中心办手续的时候,会发现使用的人脸识别设备和指纹采集设备就是依图科技的产品。 再比如:商汤科技。这是中国第一个可考朝代——商朝的开国帝王,也体现了商汤科技的霸气和野心。 2017年8月底,商汤的技术应用在了苏宁在南京出的全国首家真实投入运营的无人店——苏宁体育 Biu。其产品帮助苏宁探索自助化售货,智能追踪用户在不同货品前的停留时间等。 旷视也在做这类探索,只不过地点选在北京联想桥附近的物美超市,据旷视供应商透露,这类产品配件出货量一年在一两千套,还处于萌牙状态。 旷视也在别的领域攻城拔寨。9月2日下午,旷视的一张路演照片在微博上流出,图片上展示着旷视的人脸识别技术可用于追踪学生的课堂行为,辨别学生的“听讲”、“走神”、“睡觉”等行为。 云从的策略则和依图、商汤、旷视不同,依据中科院背景,云从希望成为国家四个人工智能平台之一。通过国家层面,做成人工智能基础资源公共服务平台后,有些事情做起来就会方便很多,比如与公安部、银行成立联合AI实验室。 这种架构益处颇多,既能拿到机构稳定订单,也可以规避数据安全性质疑。在没找到独特优势前,云从想先独辟蹊径,保障自己立于不败之地。 AI大浪拍向岸边以前,各村都在想着各村的高招。 ZAO的疯狂用户裂变,旷世排队IPO,让本已平静的四小龙格局再次起了波澜。 从整个人类社会看,AI视觉扩展了生活空间的维度,也让更多的人享受到便捷、舒适和快乐,是目前最具想象力空间的技术之一,在这个领域,诞生出一家乃至几家伟大的公司并不稀奇,280亿估值能否进一步激发这些已经领先一步的创新企业,用成熟的产品把梦想照进现实?最终的AI商业帝国究竟由谁缔造? 一切只有AI能够预知。
特斯拉向左,阿里向右?车联网未来寻路 燃油车市场,正面临一场前所未有的衰退。 2018年全球车市遇冷,结束连续7年的上涨趋势。作为占据全球汽车销量30%的最大市场,2018年中国车市结束近20年的高速增长,同比2017年销量下降2.8%。 在全球经济放缓的影响下,传统汽车制造强国间“硝烟四起”。美日贸易谈判最终以8月25日安倍宣布维持对美汽车关税不变达成协议。美德间激烈的汽车贸易摩擦,迫使德国不得不在战略上更靠近未来潜在的竞争对手中国。 存量残杀不是长久之计,技术革新才是重振经济的根本所在,车联网技术就是核心战场。 技术难题 2012年特斯拉ModelS横空出世,率先提出未来驾驶概念,让车联网成为汽车行业乃至公共交通领域最具颠覆性的热门话题。 对于车联网一个普遍的误解是“为车上的人连上网络及服务”。如果车联网仅止于此,那么它不过是继手机之后,在众多移动终端之中一个并无特殊的新来者。 真正的车联网是物联网的细分。未来,由汽车和道路组成的数据,将在庞大的网络体系下进行实时交换互动。汽车作为一体化网络的移动终端,以车内网、车际网和车载移动互联网为基础,在车与车、路、行人及互联网等之间,进行无线通讯和信息交换的大数据联通,实现智能化交通管理、智能动态信息服务和车辆智能化控制的全方位协调。 想象一下,在智能化的车联网体系下,如果前方道路拥堵,其余汽车将收到前方汽车的实时路况数据提前绕道。 如果汽车发生事故,事故车辆将首先通过车内网自行诊断汽车受损情况,主动联络交警、保险公司甚至是医院等相关机构,周围车辆将受到该车辆的安全提醒信息并暂存事故图像备查。 最具想象空间的是自动驾驶的实现。成熟的车联网将整合道路、车辆的实时信息涉及最优化的路线方案,将人从需要高度集中的驾驶中解放出来,有望解决汽车从诞生之日起的终极难题——驾驶安全风险和城市通行压力。 因此,车联网代表的不仅是一个普通的移动终端,而是数字化万物联通的未来。这样颠覆性的技术如果得以实现,汽车领域将面临从主导角色到行业格局的全面洗牌。 首先,科技公司将成为汽车制造的全新参与者,打破传统车企的对汽车制造和利润的垄断。发动机、变速箱等传统燃油汽车的核心技术,始终被西方传统车企掌握。 而未来,车联网汽车系统将成为新的核心,通讯技术的复杂度以及跨领域的难度,使得传统车企不得不与科技公司合作。 麦肯锡报告显示,预计到2030年,全球汽车数据盈利收入可能高达7500亿美元,其中软件系统盈利将占整车的30%。同时,基于5G技术的发展和多年来在互联网通讯技术的积累,中国有望在政策扶持下弯道超车,抢滩登陆车联网赛道。 纵观当今车联网发展格局,究竟未来的车联网系统领域中美企业谁主沉浮,在一切商业运营之前,还要看技术。 从技术难度来说,除了汽车对电子零部件的使用寿命可靠性要求、对处理器的恶劣环境适应性要求、以及人机交互要求都远高于智能手机以外,车联网的实现一个核心难题在于机械语言和IT语言的不匹配,从而给系统对车辆各部件的精准控制产生障碍。 这个难题一方面来自于天然的语言系统区别的难点,另一方面可以算作人为的难点。机械语言和IT语言的天然难点,可以理解为一个语言的母语使用者,在遇到外语时不仅需要就已有的语言对照翻译,甚至要生成、引入、解释原有语言文化里所没有的词汇和内容。 人为难点一般发生在科技公司和传统车企的车联网合作之中。如今智能汽车制造大抵有两种模式。 第一种合作是以BAT、苹果、谷歌为代表的科技公司,利用互联网技术发展汽车操作系统,与传统车企合作研发智能汽车。第二种是以特斯拉为代表的,从系统到机械进行一体化研发生产的全新车企。 在合作模式中,传统车企想要保有汽车制造的主导权,在合作时大多持保守态度,对整车的核心数据和机械技术有所保留。这不仅是基于合作间的博弈,也是由于在智能交通基础设施尚未建成的今天,未完善的车联网技术并不能保障行驶安全(参考特斯拉几起事故),以及并不能吸引消费者买单。 对这两大难点的突破以及部分克服,最终决定阿里和特斯拉在车联网系统技术上先胜一筹。 开放式系统 为理解各公司的车联网系统产品及其优劣,本文将其对标智能手机系统,总结车联网系统如Android和iOS一样,存在开放系统和封闭系统两种模式。 对标智能手机系统,合作模式的产品方向是发展出类似Android的开放式系统。Android系统是谷歌公司开发的开源操作系统。系统源代码向所有手机厂商开放,厂商可以任意修改代码并开发出个性化的手机产品。 在车联网时代,科技公司提供核心的底层操作系统,开放空间让不同的汽车根据品牌定位和产品策略的需求进行深度定制。 就目前各企业发展成果而言,第一种模式中,由阿里研发的AliOS最具备接近理想车联网技术的潜质。 首先,虽然苹果和谷歌拥有庞大的手机端用户资源和技术经验,但二者在车联网上的研发尚未有突破性的成果。严格意义上说,苹果的CarPlay和谷歌的 AndroidAuto目前只是 iOS和Android应用到车载屏的映射软件,仍需要手机连接USB到汽车端,这显然与车联网的目标相距甚远。其中CarPlay仅适用于iPhone的设计进一步限制了其市场的拓展。 虽然百度在无人驾驶和AI上投入很大精力,但其设计的小度OS和腾讯的TAI类似,并不算严格意义的OS,而更像是为了满足传统车企迅速上线联网功能的解决方案。无论是小度OS还是TAI,其本质是基于手机Android系统进行基础修改后,做出的包含智能导航、语音交互等功能的“超级APP”。 虽然作为一种轻量化解决方案,超级APP有开发周期短、投资成本低的优势,但是在车辆控制技术上有明显的缺失。缺乏底层系统的改良,根本无法有效与车辆的硬件结合,且传统车企满足于上架一辆名为“智能汽车”的产品,却几乎没有对车进行改造,这就导致之前所说的机械语言和IT语言的不匹配。 同时,当后期Android系统升级时,由于没有与系统下层深度结合,只能在现有功能上实现升级,无法凭空调用新的下层接口实现新功能。再者,由于无法彻底升级而导致的系统漏洞等带来的技术维护,成本非常巨大。因此,百度、腾讯的超级APP的更新升级潜力相对有限。 相较之下,阿里的在智能汽车系统上的决心相当大。 AliOS虽然也是基于Android系统,但在内核、硬件驱动和系统服务等底层内容上进行了重构,平台开放了包括云应用开发、场景智能感知等6大类60余项底层系统级别能力,形成了既有底层系统改进、又有个性化功能定制的一个整体打包解决方案。 除了自身技术,阿里的合作伙伴上汽,不同于其他传统车企的保守态度,向阿里开放了大量权限进行深度合作,并随着系统的发展来改良原有的汽车机械架构。 这使得阿里与上汽的合作,相当程度上有空间和机会克服机械语言和IT语言的不匹配,将硬件资源深度整合、优化和集中调用,对汽车硬件调度更为合理。 封闭式系统 除了合作模式外,车联网系统的开发也有可类比为苹果iOS的封闭式系统。iOS系统为全闭源,只用于苹果自己的产品中,有限授权第三方厂商使用,用于软件开发。同样,在车联网领域,也存在从系统到整车由一家公司开发制造,系统不开放给所有汽车的发展模式。 这其中的代表企业就是特斯拉。 利用机电一体化技术,特斯拉进行“系统+机械”全包的设计研发,机械硬件为系统控制而改良,系统也为机械硬件而修改,将机械语言和IT语言融合,这就使得特斯拉的ModelS实现了在联网状态下随时升级、远程诊断、自主求助甚至是自动驾驶等车联网功能。 虽然特斯拉的技术尚不完美,相关安全事故频发说明系统的进一步完善十分必要,但是它已经展示出车联网未来的曙光。 这样来看,阿里和特斯拉都是非常具备竞争力的种子选手。 从技术上来说,未来的车联网在封闭系统和开放系统两条方向,很可能是春兰秋菊各擅胜场。但在实际推进上,这还需要考验企业资金链和产业资源整合能力。 因此,未来的车联网之争,是阿里称雄还是特斯拉称霸,还需时间验证。