近日,苏州思必驰信息科技有限公司获得数亿元人民币Pre-IPO轮战略投资,参与本轮投资的包括珠海大横琴、美的资本、上海交大基金会旗下菡源资产、中信证券投资、元禾控股等知名投资机构。 思必驰总部位于苏州,在上海、北京、深圳均设立分公司、研发中心,是国内领先的对话式人工智能公司,拥有全链路的智能语音语言技术,包括声学信号处理、语音识别、语义理解、任务及知识型对话管理、知识问答及聊天、语音合成、声纹识别等,自主研发了人机对话系统与语音芯片,为物联网智能终端、智能汽车等客户提供软硬一体化的全链路语音交互解决方案,为金融、政务、医疗等行业提供以对话式AI为主的“数字智能助理”解决方案。 本轮融资后,思必驰将持续加大核心技术的研发投入,增强源头技术的持续创新力;加大对AI芯片、软硬一体化的语音交互解决方案的研发投入,加快产品方案升级,协助客户打造一流的人机交互产品体验,巩固在物联网智能终端市场的优势地位;在“新基建”时代背景下,加速赋能金融、政务、医疗等行业的智能化升级,以AI助力降本增效,提升行业的管理与运营效率,助力业务价值创新,为智慧城市建设注入新“智力”。(谢岚)
如果你觉得,美国最近在中美科技战中过于针对华为和Tiktok,那你就错了。 随着中美在科技层面的交锋与冲突不断升级,美国商务部开出的实体清单也是一泻千里。5月23日,实体清单上又多出了33家中国公司,大都为科技公司、科研机构。截至5月底,美国实体清单上的中国公司、个人、甚至还有几所大学,总数多达1373家,整整309页PDF文件。 遥想去年5月,这个清单上62个国家和地区的实体,总共只有1182个。其中俄罗斯以316个实体位居第一,中国只有233个实体上榜,其中80个在香港。 所谓“实体清单”,是美国的出口管制手段。在没有许可证的情况下,美国任何企业不得向清单上的实体出口任何东西,也不能帮助这些实体进口任何东西。1997年6月,“实体清单”面世4个月后,中国工程物理研究院,成为了清单上的第一个中国实体。 20多年过去,实体清单已经从美国的出口保护手段,变成了阻碍别国科技发展的打击手段。 语音科技,就是一个美国不愿意让我们发展的太快的科技。 国内的语音科技“一哥”科大讯飞,就在去年10月被美国“拉黑”了,当时科大讯飞的很多开发平台使用的都是美国芯片,被“拉黑”后,在美国的很多实验室也被迫关闭。 不过,在同期被“拉黑”的公司中,科大讯飞算是最淡定的。当时科大讯飞发布公告称,其人工智能核心技术都是自主研发,而且语音科技在硬件方面对芯片的要求并不是特别高,找到替代品或者自己研发,问题都不大。 本周三,科大讯飞董事长再次提及公司被加入实体名单一事,他表示,目前科大讯飞已经有了28nm制程的自研芯片,完全无惧被美国芯片卡脖子。 另一方面,由于谷歌在重压之下已经不再给华为提供语音助手服务,这个服务将由科大讯飞接手。科大讯飞不仅能稳稳地接住华为,提供的服务还更好,在欧洲各主要语种方面都能超越谷歌。 可能是受到科大讯飞的自信影响,周五语音技术板块5支股票全线拉升。科大讯飞收涨5.05%,是近两个月内的最大单日涨幅。 1. 语音技术:从科研到应用 虽然目前语音技术的研究方向主要放在专业领域的语音录入,比如医院、法院等,需要记录的专业词汇多、而且要绝对精准的领域。但是语音技术离我们日常生活最近的应用,正是已经非常成熟的手机助手和日渐普及的智能家居。 语音技术的起步,是语音识别。语音识别技术主要是把人类的语音内容转换成计算机可读的输入,不一定是文本,也可能是编码或者符号。 由于语音交互提供了更自然、更便利、更高效的沟通形式,成为人机互动的主要输入方法,只是时间问题。 目前,主流语音识别框架还是由3 个部分组成:声学模型、语言模型和解码器。其中,声学模型是热门的研究方向,也就是业界跑马圈地的方向。 语音识别没有什么技术壁垒,就比谁的算法更准,因此国内外各大企业前赴后继的发布着新的声学模型,刷新各个数据库的识别记录。 由于中文方言的博大精深,语音识别的复杂性基本拉满。因此,在声学模型方面的研究进展较其他国家都要快一些。在其他国家把英文识别做到了最好的时候,科大讯飞已经可以识别中、英、粤三语混说的输入了。 事实上,语音识别技术在2010年前后,碰到了天花板,识别率达到了90%,并且难以突破。直到深度学习技术被应用到了语音识别中,识别精度才突破了90%,在安静环境下的识别精度直逼98%。 从此,语音识别领域的产业竞争从研发转为了应用。而在语音识别的精度普遍都能达标之后,语音识别也失去了独立存在的价值,开始更多的为提升其他产品的体验而服务。 也就是这个时候,语音识别相关产品,比如Siri,开始走进人们的视线。不过,Siri们的出现所引起的关注程度,远比实战成绩要高的多。Siri面世的时候,谷歌CEO忧心忡忡,认为它会对谷歌的搜索业务产生根本性的威胁。 但是并没有,Siri的语音识别作为苹果手机的附加功能,其适用范围似乎也被限制在了控制手机:报时、报天气、跟主人聊天解闷。 2015年,语音赛道跑出了黑马 - 亚马逊推出了智能音箱Echo,上面搭载了语音助手Alexa。Alexa跟Siri最大的区别,其实只有脱离了手机,打破了距离的限制。但这显然让消费者看到,除了可以“无手”控制手机,还可以“无手”控制任何家电。 对于躺到床上才发现忘关灯了的人来说,简直称得上21世纪最伟大的发明。 而国内的语音识别“一哥”立刻跟上,与京东合作推出了智能音箱“叮咚音箱”。不过,叮咚音箱在国内市场出师不利,2015年,国内智能家居还未普及,消费者显然还没有想到这个东西买回家能干嘛。 销量扑街的“叮咚音箱”,让围观智能音箱的国内科技巨头,觉得“就这”,然后纷纷退场。 然而,亚马逊Echo的销量却让这些企业大跌眼镜。从15年6月面世到16年底,Echo在美国的销量突破了1000万台。此前,除了Apple Watch,摄像头之类的智能配件,能买100万已经是不错的成绩了。 这次,围观智能音箱的全球科技巨头,都觉得“有戏”,纷纷加入了赛道。 2. 智能音箱的红海 2017年,全球智能音箱市场总价值20.7亿美元,根据当时的预计,这个数字将在2025年达到206.8亿美元,年增长率33.4%。 而在智能音箱市场迅速扩张的过程中,亚马逊作为“领路人”,市场份额也遥遥领先。但是亚马逊、谷歌和其他杂牌三分全球市场(基本也就是美国市场)的局面,在2019年遭到了冲击。 这一年,美国市场上,杂牌已经被亚马逊和谷歌挤没了,而阿里巴巴、小米、百度迅速崛起,三家加起来迅速占据了近25%的全球智能音箱市。 2019年,全球智能音箱总销量为1.469亿台,较2018年增长了70%。其中,2019年中国市场的智能音箱出货量为4589万台,占全球销量的30%。 2020年前4个月,在国内其他消费市场由于疫情的冲击出现断崖式下跌的时候,智能音箱销量虽然同比下降了14.7%,但仍然卖出了1056万台。可见智能音箱作为现在的风口,抗风险能力还是挺强的。 而目前国内智能音箱三足鼎立,阿里巴巴、百度、小米三大互联网平台分别搭载的三个智能语音助手:天猫精灵、小度和小爱同学,在疫情的影响下,马太效应加剧。 2020年1-4月阿里巴巴、百度、小米的市场份额分别为35.2%、30.9%和30.4%。 突如其来的疫情除了加大了国内智能音箱的品牌集中度,在线教育的普及还顺便推了一把屏幕音箱的发展,给龙头企业指出了未来的方向。今年上半年发布的屏幕智能音箱新品,纷纷突出了影音、网课、早教资源等以内容为主的功能。 2019年,带屏幕的智能音箱市场份额达到了14.2%,2020年上半年达到19.8%。其中2020年1月、2月以及6月的屏幕智能音箱销售占比均突破了20%。 不难看出,全球的智能音箱市场正在飞速的增长,而这其中,人口基数大又在经历消费升级的中国市场,发展的尤为迅猛。 截至2019年,中国的智能音箱用户数量,已经超过了智能音箱曾经的主场 - 美国。但是,中国智能音箱用户只占到全国互联网用户的10%,而美国的用户占全网用户的26%。 虽然美国巨头仍然占据着绝大部分的智能音箱市场,但侵略国内市场实力明显不够。亚马逊和谷歌在中文处理相关的技术上非常薄弱,而且也没有屏幕智能音箱产品,很有可能还没进中国,中国消费者已经觉得它们“out”了。 可以说,留给中国智能音箱和语音技术的市场很大,时间很多,科技战的战火,也还烧不到它。
王鸿 8月11日-12日,第四届地新引力峰会于上海宝华万豪酒店举行,地产、资管、物业、租赁、产业、科技、金融、区块链、文旅等行业领袖齐聚,思考特殊时期的破局之路,探寻地产的第二增长极,全程直击。现场直播》》 科大讯飞听见科技商用级产品总监孙鹏介绍到,讯飞1999年成立,在20年内一直致力于智能语音和人工智能技术的研究和产业落地。 他表示,目前国内疫情趋于稳定之后,会把人工智能面向于各行各业赋能,帮助行业去做数字化、智能化的转型升级。未来的人工智能会有两大趋势值得关注,一个是在认知智能领域当中,人工智能可以学习行业专家的一些专业知识,水平可以超过普通专业人士的90%以上,能够帮助人类去释放解决更多重复性的劳动,帮助节省大量的时间去做一些更创造性的工作。 还有一个趋势是万物互联时代的到来。万物可对话、可交互的趋势,也在逐渐成为一个现实。 语音交互是人类之间最自然的交互方式,也是人与机器之间最和谐的交流方式,比如现在很多语音交互,智能手机会用语音助手去发短信、打电话,车载不需要去用手进行导航、搜索,用语音的方式就可以进行搜索。 同时在行业当中也可以用到语音交互技术,对于我们智慧家居、智慧养老、智慧病房、客房、智慧办工等等场景下,语音交互都改善办公环境,提升生活体验。希望通过科技的方式,赋能各行各业,为各行各业带来新的增长点,助力经济转型,推动智能化建设,希望人工智能技术能够建设美好世界。
近日,由创业家&i黑马联合、新浪财经、财联社旗下科创板日报等多家媒体,携手60家投资机构共同发起的“新基建产业独角兽TOP100”榜单重磅发布,出门问问作为国内领先的人工智能公司从数百家企业中脱颖而出,入选榜单。 作为新基建重要领域之一,人工智能处在具有带头作用的战略位置,其对包括5G、大数据中心等技术在内的各新基建科技端领域建设具有重大促进作用。眼下,我们已经在交通、物流、教育、医疗等众多垂直场景体验到人工智能带来的便利,碎片化的人工智能应用将在短时间内迎来整合,使大众消费者获得全面革新的生活方式及体验。 出门问问作为全球人工智能独角兽企业,深耕语音赛道,拥有完整的“端到端”人机交互相关技术栈(声音信号处理、热词唤醒、语音识别、自然语言理解、语音合成等),在人工智能的基础层、技术层、应用层有着深厚积累与大量实践案例。 据了解,在智慧出行这一重要的人工智能应用领域,出门问问围绕未来汽车生态链打造了一系列基于人工智能技术的落地产品,包括车载语音交互系统平台以及面向开发者的车载语音交互系统开放平台等,其中的嵌入式语音交互系统包括全套的语音技术,包括信号处理、固定唤醒词、自定义唤醒词、快词(比如车载地图控制和音乐控制命令)、语音识别、自然语言理解、对话管理、语音合成等。 驾驶场景下,通过语音进行车内控制、在线服务搜索等操作能够大大提高驾驶安全系数,是非常明确的刚需和行业趋势。出门问问主导研发的前装车载语音交互系统平台已用于奥迪、帕萨特、新迈腾等多个全新畅销车型,2020年预计前装量将达到100万辆。 除智慧出行之外,出门问问基于人工智能语音技术的定制化机器人也出现在各个传统领域,大大提升社会效率。包括为疫情防控紧密研发的小问疫情防控机器人,以及为多个银行、金融机构研发的“问真”智能反欺诈解决方案等,有效提高了传统人工通话的效率与准确率,并释放了大量人力成本。 出门问问表示,人工智能作为前沿科技,出门问问充分发挥企业技术优势,积极参与国家和行业单位主导的国标、行标建设,并为行业标准的应用和发展献言建策。未来,人工智能将持续在智慧金融、智慧教育、智慧医疗、智慧交通等领域中深耕精进,推动各行业完成智能化转型升级,实现新旧动能的转换。出门问问将持续推动AI新基建应用探索,为社会带来更高效率、为消费者带来革新生活方式。
摘要:智能语音机器人通过人工智能的深度学习,通过创建机器人模块中的流程编辑器,可自助创建会话逻辑,并在交流中不断优化话术。 随着数字经济的快速发展,传统的人工服务、客服营销模式已不能满足现代金融企业的运营需求,金融服务升级迫在眉睫,智能语音机器人需求高涨。 01、智能语音机器人在金融领域的多场景应用 智能语音机器人是基于人工智能技术、机器人技术,同时融合计算机视觉、大数据、云计算、自然语言处理等技术手段,具有语音识别、语义理解、语音合成和对话管理等功能的智能语音交互系统。在金融行业向智能化信息化转型的过程中,智能语音机器人正日益深入金融服务的方方面面。 目前,市场上常见的金融智能语音机器人有电销机器人、催收机器人、客服机器人等,通过创新AI、深度学习、情感分析等技术,已逐渐代替大部分人力在金融领域实现完美应用。华北工控总结其技术特性,主要有以下几方面优势: 出色的深度学习能力 智能语音机器人通过人工智能的深度学习,通过创建机器人模块中的流程编辑器,可自助创建会话逻辑,并在交流中不断优化话术。 实时语音交互功能 智能语音机器人通过语音即时识别系统,能够在很短的时间内快速识别语音信号将其转成文本,基于语音理解生成回答的话术实时播放出去。 强大的数据存储能力和高稳定性 在电销和催收等金融服务中,智能语音机器人通过搭载高性能计算机硬件,支持庞大数据流的处理与存储,支持长期性、重复性的外呼与对话。 ······ 由于金融业务的快速扩张,智能语音机器人的功能还在不断完善。在这个过程中,华北工控依托核心技术打造的面向语音识别系统的系列高性能工控硬件,可完全满足其对嵌入式计算机在品质与性能方面的技术诉求。 02、华北工控―语音识别系统计算机产品方案 基于语音机器人的智能化、多样化技术诉求,华北工控积极引入人工智能、大数据、互联网等先进技术赋能工控硬件产品创新,采用飞腾、瑞芯微(603893)、恩智浦等平台智能芯,打造了多样化板卡方案可为其提供硬件支持。 华北工控语音识别系统计算机产品方案 高稳定性 华北工控应用于语音识别系统中的计算机板卡严格按照工业级标准打造,尺寸小巧、采用低功耗、高集成处理器,AII In One设计,支持宽温作业,防浪涌设计,可有效延长产品使用周期。 高扩展性 产品具备超高清音/图像/视频处理能力及强大的应用计算能力,多IO功能接口设计可满足多种外设接入需求。 强大的语音处理能力 产品集成多核访存通道,支持多路通道录音,支持24小时语音存储,支持音频输入输出及功放,支持网络实时传输,可广泛为交互式客户端、媒体播放、信息系统、金融设备等众多领域提供领先的硬件解决方案。 目前,智能语音机器人已在多家国有大行、金融行业实现应用落地。华北工控不断迭代优化计算机硬件的产品性能,可助力智能语音机器人为金融机构提供更先进、专业、智能和个性化的技术支持。
“你好,欢迎来到对答如流,两会‘智’通车。”一位面带微笑的女主播在屏幕中向用户打着招呼,但是,这位主播并不是真人,而是AI主播“小智”。“小智”主持的两会“智”通车,是一款由百度智能云和央视网在两会期间联合打造的全国首个集智能对话、语音交互、社交分享于一体的时事AI产品。 5月21日起,全国正式进入两会时间。为了向公众普及两会知识,百度智能云携手央视网共同推出了两会“智”通车,依托百度成熟的人工智能技术,以AI主播发问的形式带领参与者回答问题,了解国事,近期获得了网友们高涨的参与热情和一致好评。 如果仔细观察“小智”的细节,我们会发现,她的动作与神态和真人如出一辙,讲话的过程中微笑、自然眨眼等各种面部表情十分逼真。同时“小智”的口型和讲话内容实现了真实的贴合,面对不同的答案也有着不同的交流反应。在这样一位AI主播的带领下,参与者可在两会期间每天享受“智”通车的线上答题乐趣。这种愉悦的体验背后,是百度智能云的强大技术加持,让“小智”集人像美、善交流、懂说话三大亮点于一身。 人像美 这次挑起大梁的“小智”外形来自于百度设计的3D高精度仿真人像,对话时真实感与科技感兼备。结合AI和计算机图形学自主研发的超写实、高精度3D数字员工驱动方案,支持合成语音输入,生成音唇精准同步、表情丰富逼真的人像动画,具有高泛化、低延迟的特点,并且支持表情风格和肢体动作的定制化。 百度虚拟数字人基于真人录像,机器学习人的说话声音、唇动/表情/动作规律,对人像的形态和声音分别进行复制与合成;塑造3D高仿真人像,模拟人脸肌肉组织,以算法驱动人像模型的唇形、表情和动作。支持3D效果,全方位、多角度呈现,面部细节更细腻,展示更多细节;更具艺术性,能够对形象进行艺术设计。 善交流 “小智”在与人沟通时,反应灵敏,对话顺畅,这基于百度强大的语音识别及语音合成能力。百度ASR(自动语音识别技术)采用先进的截断注意力模型(SMLTA),摒弃市场上传统的Attention基于整句的服务,使用语音流进行截断实现完整流畅的交互,提升相对字准率15%,计算速度与传统CTC技术持平。百度TTS(从文本到语音)运用先进的Wavenet深度学习神经网络算法将文字合成为多种语言的不同语音。 随时发问,随时打断,“小智”会说也会听。内置的百度语音处理方案,具备超强抗干扰能力。 懂“说话” 信息太多记不住,“小智”帮你抓重点。百度自研的动态标记语言能够灵活配置多媒体信息展示,还能到点提醒你:“关键词命中率50%,加油!” 简单点,说话的方式简单点。“小智”直观的信息展示,让信息传递效率大幅提升,知识获取更加高效简单,让多位网友直呼“要是我小时候有小智这样的同学一起学习就好了!” 当前,央视网正按照中央广播电视总台“5G+4K/8K+AI”战略布局,持续加大人工智能、5G等新技术的研究与应用,从基础设施层面到AI中台统一建设,打造出技术领先、安全可靠的智能新媒体平台,创新媒体表达和传播方式,开发全场景智能化产品和服务,壮大主流舆论阵地。央视网此次与百度智能云开放合作,通过拥抱新技术,做“5G+4K+AI”全媒体应用的践行者,为全国观众提供更多的优质内容和智能化场景服务,增强主流新媒体的传播力、引导力、影响力、公信力。 5G时代下,较低的带宽传递信息,较高的带宽传递情感。消费级人工智能产品的落地,需要打通人与机器之间的情感隔阂。“小智”的出现也在不断印证着AI时代人机交互新方式的可能性。两会“智”通车之后,央视网还会有更多有趣的智能化交互新产品呈现在大家眼前。百度智能云与央视网的合作,将在媒体行业产生强大的示范效应,加速AI技术在新媒体领域的落地应用。(编辑 张伟)
在今年的全国两会上,“新基建”被首次写入了政府工作报告。5月22日,国务院总理李克强作政府工作报告指出,加强新型基础设施建设,发展新一代信息网络,拓展5G应用,建设充电桩,推广新能源汽车,激发新消费需求、助力产业升级。 作为新基建重要领域之一,人工智能处在具有带头作用的战略位置,其对包括5G、大数据中心等技术在内的各新基建科技端领域建设具有重大促进作用。除了巨头布局,一批新兴的独角兽企业也已加入到“新基建”浪潮之中。 出门问问作为全球人工智能独角兽企业,深耕语音赛道,拥有完整的“端到端”人机交互相关技术栈。《证券日报》记者从出门问问了解到,在智慧出行这一重要的人工智能应用领域,出门问问围绕未来汽车生态链打造了一系列基于人工智能技术的落地产品,包括车载语音交互系统平台、AIoT联动(智能家居及可穿戴设备)以及面向开发者的车载语音交互系统开放平台。 据介绍,驾驶场景下,通过语音进行车内控制、在线服务搜索等操作能够大大提高驾驶安全系数,是非常明确的刚需和行业趋势。出门问问于2017年携手大众汽车集团,在两年时间内研发完成了一整套离在线结合的语音交互系统,其中的嵌入式语音交互包括全套的语音技术,包括信号处理、固定唤醒词、自定义唤醒词、快词(比如车载地图控制和音乐控制命令)、语音识别、自然语言理解、对话管理、语音合成等。 目前,出门问问主导研发的前装车载语音交互系统平台已用于奥迪、帕萨特、新迈腾等多个全新车型,2020年预计前装量将达到100万辆,2023年预计将达到560万辆。 在推动新基建5G快速发展的政策背景下,可穿戴设备、智能终端、智能家居将提供更加高速的连接和更加人性化的使用体验,相关市场规模也将加速增长。出门问问基于不断迭代的“嗨小问语音助手”,将汽车、智能可穿戴(TWS耳机+智能手表)、智能家居等联网产品打通,随时在车载场景下对其他设备进行语音控制。 出门问问CEO李志飞认为,未来的人工智能应该提供环境式的体验,虚拟个人助理的载体不再局限于智能手机或者智能音箱,而是出现在每一个拥有计算能力的硬件设备中,包括汽车、可穿戴设备、智能眼镜、VR/AR设备等。不久之后,消费者将能够体验到呼之即来挥之即去,全覆盖式的AI服务。 为加速扩大智慧汽车生态规模,出门问问上线了用于开发复杂车载系统的开放平台,将行业领先的底层AI语音能力开放,供开发者在平台基础上实现高质量的技能开发,实现快速落地应用。作为智慧出行的坚定推动者,出门问问将探索更多语音技术与车载场景结合的可能性,为消费者提供更具科技感和高效价值的驾驶体验。 出门问问方面表示,作为新基建重要领域之一,出门问问在人工智能的基础层、技术层、应用层均有着深厚积累与大量实践案例,未来将持续推动AI新基建应用探索,为社会带来更高效率、为消费者带来革新生活方式。(编辑 张伟)