2020年12月22日,由a&s传媒主办的“2020人工智能创新应用峰会暨a&s十大品牌2020创新应用评选颁奖典礼",在深圳绿景锦江酒店(600754)盛大开幕。本次峰会以“新基建 新机遇”为主题,汇聚业内资深专家、领先企业嘉宾、行业用户等等,共同探讨在“新基建”建设热潮下,人工智能、大数据、物联网等新兴技术在安防行业的融合应用,为安防行业的智能化发展提供新的新的路径和方向。 华为机器视觉副总裁潘志超应邀参加活动,并在论坛上发表《用智慧之眼感知万物,点亮智能世界》的主题演讲,和业内专家就《新基建 新机遇》进行圆桌论道。 潘志超在演讲中分享到: 进入5G时代,机器视觉不仅成为各行业数字化的感知入口,更是各行业数字化的抓手。 在新基建的大背景下,华为提出智能体的概念做为智能升级的参考架构,而机器视觉通过视觉全息感知成为智能体中的核心组成部分。 但是在产业发展和智能落地的过程中,我们也发现智能在落地过程中存在“叶公好龙”的情况,如认为: 我有人,不需要人工智能; 智能不成熟、不好用; 智能很贵; 我已经有智能(其实是一个环节的智能); 智能的场景和应用都是固化的; 智能是大厂商间的游戏; 视频监控智能化是传统方案的简单升级…… 如何扎实的推进智能的行业落地? 2020年以来,华为在机器视觉产业有系列重要动作,如华为智能安防更名为华为机器视觉、软件定义摄像机国际标准的发布等等,每一个动作都意义非凡。华为在扎实的通过产品、标准、产业等多个维度推进智能的行业落地。华为通过“软件定义摄像机+智能视频存储+好望云服务”的三大产品、“平台+生态”的开放体系和理念,持续拓宽AI的深度和宽度,携手合作伙伴共同促进机器视觉产业开放共生、智能共赢的发展正循环。 当前,华为已经在智慧交通、智慧社区、综合园区、智能制造等行业场景中,将智能深入到行业生产的各个环节,激活机器视觉的行业智慧应用,赋能行业百花齐放! 基于华为机器视觉在2020年为产业做出的突出贡献,经过a&s对国内外企业深入的调研和专业的评选流程,华为获得a&s2020智能安防、新基建领域的“十大”品牌创新应用。
AI席卷百业,作为AI时代的两个主要入口,智能语音产业已经进入爆发期,计算机视觉在新基建的推动下正在成为AI落地规模最大、应用最广的领域。 在语音和文本智能领域,无论是面向公有云市场的七陌云客服,还是面向大中型机构的容CC,容联一直在引领行业创新,构建了基于智能客服、智能联络中心的商业闭环。 在视觉领域,容联又是如何在原有能力上做延伸和商业化落地的?近日,CPS中安网对容联云通讯AI视觉解决方案总监陈开仡进行了采访,并关于通讯服务、AI技术、智能化视频监控等话题进行了交流与探讨。以下为访谈内容: Q:容联云通讯的核心技术和产品优势主要集中在哪些方面?容联提出的视觉智能服务与传统视频监控的区别是哪些? 陈开仡:当语音和文本、视频智能化在通讯业务中的应用已经大量普及的时候,容联意识到当下市场对于图像识别具有大量的需求,因此容联开始了计算机视觉(CV)的调研和研发。 由于CV与NLP深度学习技术上具有相通性,并且容联拥有NLP引擎相关技术的积累,因此迅速掌握了CV场景的相关技术。 容联的优势在于针对特定场景的数据进行增强处理,将AI和传统技术结合,以及前沿技术工程化的能力。 比如说准确率,以智慧工地为例,容联的“慧眼”视觉分析平台可结合工地复杂现场做全方面检测,做安全帽佩戴检测时容联产品准确率可以超过90%。 AI算法极度依赖数据,但是很多情况下有效的数据采集又比较难,容联自有的数据增强处理技术可以在素材比较少的情况下获得比较好的效果。 深度学习技术十分依赖训练数据,且深度学习输出结果中一般都有“阈值”限制,实际应用中,很难设定适用于所有场景的统一阈值。 目前AI技术在落地过程中仍然受到数据量、数据质量、标注成本、数据域变化等问题的制约,单纯依靠深度学习模型难以解决复杂场景下的实际CV问题。 容联具备一系列针对实际应用场景的工程化优化手段,包括图像的时序分析机制、检测目标属性过滤机制、目标跟踪及ReID机制等,提高算法在落地应用时的精度。 除了技术上的壁垒,容联产品一个重要的壁垒还是其在行业中的积累,因为做某个行业的视频识别本质上就是还是拼行业数据的积累、以及对行业的理解力。实际操作中,准确洞悉行业痛点是一个周期很长且很重的事情。 另外关于视觉智能服务与传统视频监控的区别,传统技术的一般特点是通用性较强,容联提出的视觉智能服务结合深度学习后,可在传统视频监控的基础上,得到神经网络模型输出的具有语义信息的结果,在保持通用性的同时提升精度。 例如,目标跟踪场景,利用深度学习检测图像中特定种类物体位置,结合传统背景建模、帧差法、光流法等,达到通用性与专用性的平衡协调。 Q:容联 CV 的商业化落地聚焦在哪些行业?这些行业关注的重点是什么,解决了什么问题, 提升了什么价值? 陈开仡:目前容联聚焦的行业有智慧社区、加油站、化工、城管、卫监、明厨亮灶等行业,这些行业的重点各有不同。 以监控场景为例,50个摄像头,每天24小时,产生的视频量1200小时,一个月就是36000小时。即使监控岗位人员三班倒也无法做到100%覆盖,期间很容易漏过一些突发事件,事发后再去追溯会很困难。 再比如制造业工业产线场景,工人有规定的操作规范,规定的位置,通常会有监管人员进行监督。但是产线很长,又在不停运动,监管人员很难覆盖全部工位进行督导。产品因操作不当产生的瑕疵会直接影响用户评价,对企业造成不良的影响。 我们通过智慧视觉算法,对以上行业的关键场景进行智能的监管,提升了管理的效率、覆盖率,也提高了安全管控水平,同时降低了风险并且降低了监管成本。 Q:在这个市场上有做硬件的厂商,有做整体解决方案,有围绕最终用户的系统集成商,容联跟产业上下游的厂商的区别在哪里?有哪些合作? 陈开仡:容联采用的是AI能力+垂直行业+服务的模式,并且在多个领域都有大客户积累,善于深挖用户场景,发现痛点;单个用户的痛点可能是行业痛点,针对痛点进行定制化方案,将方案沉淀为行业方案,提升整体行业智能化水平是容联的目标。 另外容联的产品设计秉承松耦合原则,模块之间支持灵活的拆分重组,可以单独提供,或跟上下游厂商产品进行灵活融合,根据客户的需求进行方案的定制。 Q:了解到容联的视觉算法商城很丰富,现在还有正在挖掘的场景和算法,容联未来还关注到哪些是没有被开发的行业需求?是否可以简单谈一下未来趋势。 陈开仡:目前还有一些行业的需求还未被开发,例如卫监、教育、国土资源、军工、港务、物流等等。 关于未来趋势的预测从技术角度来讲:一个值得关注的未来趋势是从识别到理解,套用古人的说法就是从知其然到知其所以然。 过去十多年,计算机视觉在识别方面取得了显著的进展,但是现在仅仅进行识别远远不是我们所期望的,或者说只是迈出了智能化的第一步。 仅仅有结果对企业对行业的价值仍旧有限,可以对结果进行解释,价值会更大。把物体和物体,物体和环境的联系建立起来,有了这样的从基本属性到对象直至环境的关系,就有可能实现从知其然到知其所以然。 未来最重要的趋势就是从无需知识支撑的识别到需要知识支撑的理解,做到知识图谱的效果,或者可以称之为“计算机视觉图谱”。 从市场规模角度而言:目前计算机视觉行业增速持续保持较高的增长趋势,深度学习和卷积神经网络技术的推动着计算机视觉技术,同时也驱动着整个人工智能行业的迅速发展,计算机视觉技术已在各行各业有着举足轻重的作用。 伴随着技术成熟度提高,硬件性能的飞速提升,人脸识别、物体识别、工序识别、复杂场景识别等分类、分割算法不算提升精度,未来将有更多的场景能够应用计算机视觉技术,计算机视觉企业应在强化技术打造的前提下,发掘更多垂直领域需求,解决企业痛点。 Q:安防行业受智能化、信息化技术影响,边界逐渐模糊,泛安防成为行业未来趋势,众多巨头跨界入局,行业竞争加剧,容联面对如此激烈的市场格局,会如何应对?未来的战略和规划会做哪些调整? 陈开仡:泛安防时代,无论是技术还是市场,安防行业不再是一个封闭的行业。 首先是关于产品升级,容联将侧重于三个方面去创新: 第一,让安防从被动防范到主动预警,从“看”变为“做”;利用视觉智能把安防体系从被动的记录、检查,逐渐转变为自动剖析、主动预警或即时处置。 第二,让智能安防云端化。安防行业面对的一大问题就是场景“碎片化”,这是一个不可忽视问题,大量的碎片场景带来大量的数据积累,安防体系中存储的数据量级成指数增长,这时候应用会逐渐转向云端进行处理,将复杂任务云化,既可以增加处理效率,也可以合理的进行资源的分配,容联也会针对云端领域的应用场景做深入的研究。 第三,应用场景落地。安防行业已从前两年关注各类AI算法的功能和性能,转向重视算法与具体业务的匹配衔接,追求将AI性能落实到具体业务应用上,形成具体的解决方案。容联将致力于解决各种垂直应用场景。 同时随着5G、AI的兴起,外加政策的扶持,我们认为边缘场景将会为安防行业带来新鲜活力,所以云、边、端一体化也是我们一个重要的产品规划。 据悉,11月5日,「容联云通讯」宣布完成 1.25亿美元 F轮融资,由中国国有资本风险投资基金领投,新东方产业基金、Mirae Asset(未来资产)、蓝藤资本和CloudAlpha等战略及财务投资方共同参与。腾达资本、花旗环球金融亚洲有限公司和招商证券(香港)担任财务顾问。 这是国内云通讯领域迄今为止规模最大的一笔私募股权融资。 容联表示,本轮融资完成后,容联将进一步加大在智能通讯云服务方向的技术研发投入,提升产品厚度及竞争壁垒;同时持续创新,扩容边界,在5G、新基建的浪潮中,更好地助力企业和政府组织实现数字化改造与智能化升级,推动中国企业通讯市场变革。
8月24日晚,矩子科技披露了一份触底反转的2020年半年报,第二季度,公司3D检测业务已实现了逆势增长,效益将在下半年体现。 据披露,今年上半年,公司自主研发的3D AOI(三维自动光学检测)和3D SPI(Solder Paste Inspection,锡膏检测系统)在客户开拓上不断取得突破,获得了和硕集团、比亚迪、京东方等行业标杆客户的高度认可,新产品3D SPI在第二季度取得的订单总额已超过2700万元。 “矩子是我国古代科技集大成者墨家对其首领的称呼,公司以此为名,就是希望像古代工匠一样,精雕细琢做设备。”矩子科技董事长杨勇在接受、智能制造等细分市场。 杨勇告诉记者,基于自主研发的3D AOI,矩子科技具备拓展到更多新领域的技术能力,公司率先瞄准的就是半导体、医药、miniLED等行业的机器视觉检测,目前正在开发的产品包括高速药片光学检测设备、半导体封装自动光学检测设备、miniLED AOI等。 “做中国古代工匠精神的践行者。”这是杨勇创业的信念,他期望公司成为全球领先的机器视觉制造商,为此他用“矩子”给公司命名。矩子,是中国古代墨家对其首领的称呼。
科创板持续迎来各路硬科技公司赶考。5月20日,广东奥普特科技股份有限公司(下称奥普特)科创板上市申请获上交所受理,这家由“80后”两兄弟创建的科创公司正式进入科创板“考场”。 招股书申报稿显示,成立于2006年的奥普特,是一家主要从事机器视觉核心软硬件产品研发、生产和销售的高新技术企业。公司最初以机器视觉核心部件中的光源产品为突破口,是国内较早进入机器视觉领域的企业之一。 何为机器视觉?就是用机器代替人眼进行测量和判断,是一种应用于工业和非工业领域的硬件和软件组合,它基于捕获并处理的图像为设备执行其功能提供操作指导。 虽然机器视觉市场长期被国际品牌垄断,但是奥普特已构筑起护城河。据披露,奥普特以产品核心技术为基础,建立了成像和视觉分析两大技术平台,并在此基础上形成了多层次的技术体系。公司能向下游客户提供各种机器视觉解决方案,协助客户在智能装备中实现视觉功能,提高机器视觉系统的准确性、稳定性和可靠性。 目前,奥普特提供的机器视觉产品,已广泛应用于各类高端装备中,服务于3C电子、新能源、半导体、汽车、医药及食品加工等行业及科研教学领域,并得到苹果、富士康、欧姆龙等企业的认可。 知名企业的认可,亦体现在奥普特不俗的业绩上。2017至2019年,公司分别实现营收约3.03亿元、4.22亿元和5.25亿元;归母净利润分别约7580.54万元、1.37亿元和2.06亿元;研发投入占营收比例分别为15.35%、11.82%和11.09%。 同时,奥普特的股权较为集中,公司控股股东及实控人卢治临、卢盛林是兄弟关系,二人合计持有公司85.19%的股权。从履历上看,卢治临、卢盛林分工明确:卢治临自2018年5月至今任公司董事、总经理;拥有博士学历的哥哥卢盛林,自2018年5月至今任公司董事长、副总经理、研发总监。 在发展愿景上,奥普特致力于成为国际一流的自动化核心零部件供应商,聚焦感知与决策核心关键环节,为客户提供实现智能制造所需的核心软硬件。 据披露,公司此次拟募资约14.23亿元,投向总部机器视觉制造中心项目、华东机器视觉产业园建设项目、总部研发中心建设项目、华东研发及技术服务中心建设项目、营销网络中心项目和补充流动资金。
AI视觉识别:梦想被280亿估值照进现实 9月初,朋友圈被Zao以迅雷不及掩耳盗铃之势占领。 一条条顶着自己头像和明星尬戏的视频,其背后的驱动技术是一项AI视觉技术:DeepFake。 Zao并非第一款因为AI视觉而火爆的APP,在Zao之前,FaceApp就已经爆红过,它能根据头像生成跨时间、跨性别的照片,且效果清晰,几可乱真。 与此同时,8月26日晚间,AI视觉企业旷视科技(D轮估值280亿)正式向港交所提交IPO招股说明书,开启了AI视觉独角兽冲向资本市场的新篇章。 安防,竞争并非来自内部 人类对虚拟现实的想象由来已久。 1973年,哲学家希拉里·普特南提出“缸中之脑”实验:假设一个狂人科学家将大脑从人体取出,放入一个装有营养液的缸里维持着生理活性,超级计算机通过神经末梢向大脑传递和原来一样的神经电信号,并对大脑发出的信号给予和平时一样的反馈,此大脑能否意识到自己活在虚幻之中? 如果说这个问题还离我们比较远的话,以人脸识别、虚拟成像为代表的AI视觉技术却已经很成熟。 2015年以来,国家持续出台利好政策,推动了AI视觉技术在金融、安防、医疗、智慧城市、公共安全、轨道交通、政府治理及交通等行业的应用,资本扎堆布局。这其中,依图科技、商汤科技、旷视科技、云从科技四家是代表性的企业,又被称为“AI视觉四小龙”。 目前AI视觉公认成熟的商业场景有三个:安防、金融和手机,这其中安防是传统的主战场,涉及万亿级别产业蛋糕,且靠近政府、银行等企业客户。 说得安防者得天下并不过分。 2014年,当时一家叫格灵深瞳的公司被投资人徐小平赞赏,原因是其研发出能够识别危险手势的智能设备,安装在ATM机旁,一旦发现危险就可以自动报警。新技术加上传统巨量市场,再伴随政府机构和银行客户安全的硬需求,看起来是一份可以快速商业化的巨大收入。 不过,这个产品最终没能规模化,因为格灵深瞳的产品是做智能摄像机,带3D景深,类似于AR、VR技术,但技术成熟度不够,并没到适合商用的阶段。一批AI视觉企业捕捉到了这个商机,用人脸识别实现相同的功能,而图像识别技术的成熟度是足够的。 即便如此,以算法见长的AI视觉公司要切入安防依然举步维艰,智能安防摄像头要依托于整套安防体系内才能发挥作用,但行业内已经有传统安防设备巨头,控制着大多数市场和供应商。 早先,这些安防传统巨头选择和AI视觉企业合作,按照所卖摄像机台数支付技术授权费。但后来,这些巨头决定转变模式,自己搞算法,独立开发图像识别技术。 他们迅速成立了自己的人工智能研发团队,为弥补智能算法上的人才短板,充实自身实力,同时给竞争对手釜底抽薪,甚至找猎头专门挖AI视觉企业的核心人员。 面对安防这个绝大的蛋糕,四小龙们已经不能再单单满足做背后的技术提供者了,如果想在这个领域长期扎根下去,无论正面硬刚传统安防企业的竞争,还是谋求建立更加稳固的合作关系,是短期内必须要做出的选择。 手机,等待打破固有格局者 众所周知,AI始终是创业的热门领域,但最后一环的商业化也一直是个难题,直到AI识别和手机产业相结合后,原有的天花板一下子被打开了,除了传统的安防、金融场景,AI视觉又多出一个可变现的应用。 目前世界上60%的摄像头被用在手机上,像苹果公司在AI识别上的专利收购和研发成本,已经达到近10亿美元,有分析称这个市场的收益未来不会少于金融领域。 旷视科技之前在做金融业务时,在FaceID和云上Face ID等实际应用场景上积累了很多经验和知识,于是很顺利地迁移到了手机上的人脸识别上。 二者之间又有细节上的不同,金融领域的刷脸应用,需要按银行要求摆动头、眨眼睛,但在手机端,用户不需要做这么多动作,绝大多数是正面识别;同时,手机对用户的体验要求非常高,如苹果手机人脸识别的误失率要求为百万分之一,这是AI视觉供应商必须达到的。再比如在金融应用上,人脸算法做到三、四百毫秒的延迟就很不错了,但手机的要求是延迟时间在100毫秒以内。 实际上,目前国产手机的人脸解锁功能,与最先进感知技术依然有差距,是一种折衷方案。当前国产手机主要还是用可见光和红外光感知人脸面部特征,可以理解为2D技术,这种方案不能达到区分活动的人脸与打印出来的照片的区别,因此不能应用于安全需求高的支付领域。 因此,竞争焦点在于谁能实现用户体验最优的3D结构光或者TOF测距技术。3D结构光,可以感知到人脸面部相互之间的距离,不再仅仅是二维平面图,这是目前四小龙们每天着力突破的难点。 目前的竞争格局,是不同厂商获得不同区域、品牌的人脸解锁业务,手机厂商也希望通过这种技术提供商的分摊,避免过度集中的风险,提高谈判筹码。未来随着某家企业掌握了3D结构光等升级技术,并获得技术积淀后的优势,不排除打破现有的格局,独占整个智能手机人脸识别市场。 求变,技术唯一,商用无限 在安防、手机领域之外,四小龙们也没有放松拓展其他领域商业化落地的机会。 在人脸识别上,由宜信财富私募股权母基金投资的依图科技多次在世界顶级人脸识别比赛中获得第一名,其人像识别比对系统可在0.5秒级内完成单张人像查询,并检索亿级数据库后返回精准结果,超越了人眼识别平均水平,在青奥会、珠海航展、G20峰会等活动上实际应用。 此外,其车辆识别系统能通过对车辆品牌、型号等精准识别,实现品牌识别、假套牌库分析、基于视觉特征的“以图搜车”,已经在多个省公安厅应用,并获公安部科学技术进步奖。 甚至在2018年12月,依图科技发布了一个“听写大赛”微信小程序,内嵌各语音识别引擎,由网友自行对比识别率。最终在所有场景下的语音识别,依图科技都遥遥领先。 值得一提的是,依图科技进军语音识别领域才刚刚一年的时间。 2019年5月9日,依图科技在上海召开发布会,宣布推出其首款视觉推理AI芯片产品QuestCore(求索),以及基于该芯片构建的软硬件一体化系列产品和行业解决方案。 依图的产品距离民生是非常近的,现在去出入境管理中心办手续的时候,会发现使用的人脸识别设备和指纹采集设备就是依图科技的产品。 再比如:商汤科技。这是中国第一个可考朝代——商朝的开国帝王,也体现了商汤科技的霸气和野心。 2017年8月底,商汤的技术应用在了苏宁在南京出的全国首家真实投入运营的无人店——苏宁体育 Biu。其产品帮助苏宁探索自助化售货,智能追踪用户在不同货品前的停留时间等。 旷视也在做这类探索,只不过地点选在北京联想桥附近的物美超市,据旷视供应商透露,这类产品配件出货量一年在一两千套,还处于萌牙状态。 旷视也在别的领域攻城拔寨。9月2日下午,旷视的一张路演照片在微博上流出,图片上展示着旷视的人脸识别技术可用于追踪学生的课堂行为,辨别学生的“听讲”、“走神”、“睡觉”等行为。 云从的策略则和依图、商汤、旷视不同,依据中科院背景,云从希望成为国家四个人工智能平台之一。通过国家层面,做成人工智能基础资源公共服务平台后,有些事情做起来就会方便很多,比如与公安部、银行成立联合AI实验室。 这种架构益处颇多,既能拿到机构稳定订单,也可以规避数据安全性质疑。在没找到独特优势前,云从想先独辟蹊径,保障自己立于不败之地。 AI大浪拍向岸边以前,各村都在想着各村的高招。 ZAO的疯狂用户裂变,旷世排队IPO,让本已平静的四小龙格局再次起了波澜。 从整个人类社会看,AI视觉扩展了生活空间的维度,也让更多的人享受到便捷、舒适和快乐,是目前最具想象力空间的技术之一,在这个领域,诞生出一家乃至几家伟大的公司并不稀奇,280亿估值能否进一步激发这些已经领先一步的创新企业,用成熟的产品把梦想照进现实?最终的AI商业帝国究竟由谁缔造? 一切只有AI能够预知。