“共享电单车业务高频率的消费场景蕴含着巨大的市场机遇,对美团而言具有长远的战略意义。”日前,美团CEO王兴在财报电话会上谈道,“其更高效的平均周转率将带来更好的单位经济效益,显示出短期内实现盈利的可能,我们相信这一业务拥有更大的潜在市场并会加大投入,致力于成为这一行业的领军者。” 日前,美团点评发布2020年第二季度财报称,该季度营收达247.2亿元,并投入了近30万辆电单车,其高频的骑行场景也与平台形成强有力的协同效应,未来将进一步加大投入。 据美团单车方面介绍,共享电单车符合美团探索新业务的逻辑,具有良好的市场规模成长潜力和长期回报的新商机,随着美团的加大投入,也可以看出对这一新业务进一步探索的决心。此外,共享电单车对于美团构建本地生活服务场景起到至关重要的协同效应,通过不断挖掘下沉市场的出行需求,盘活市场出行率及促进消费,提供就业岗位,以优质产品与服务打造良好的用户体验,将不断激发用户与平台的持续互动和黏性。 据悉,电动自行车作为我国民众出行的重要方式之一,目前市场保有量约为2.5亿辆。但长期以来,私有电动自行车市场问题也非常突出。严格按照“新国标”生产的共享电动自行车将极大地满足市民绿色出行需求,也解决非标电动车屡禁不止的顽疾。 美团单车方面介绍,在产品研发方面,美团电单车完全符合新国标的标准,从轮胎加宽,避震加强,限制速度、升级刹车制动等方面,解决私有电动车存在的安全问题,车辆的安全性、易用性大幅提升。美团电单车已经实现用户实名认证、智能头盔等安全管理模式,可有效防范和减少潜在盗窃事故隐患。 在有序精细化管理方面,美团电单车通过物联网,借助车载的智能终端采集车辆位置、轨迹等信息,通过高精度定位系统设置合法的停车点位,实现用户定点用车还车;广泛上线运营区域和禁停区域,保证了车辆的分布与流向得到调控;配备充足数量的运营人员对路面进行网格化管理,有力保障街头停放秩序。 在安全方面,美团也持续加大研发力度,在手机App和车辆醒目位置明确标示,严禁16周岁以下未成年人骑行、严禁车篮载人、严禁车座超载,违规用户账号将被永久封停,同时在研发AI人脸验证技术普遍应用于开锁前验证环节。针对电单车超载等现象,研发重心模式识别技术,一旦识别超载车辆将无法启动。此外,还为用户及车辆购有保险,人身与财产安全得到保障,为用户提供更安全的骑行体验。 据美团电单车相关负责人表示,将持续通过科技力量探索城市可持续发展的创新方式,为广大用户提供智能、安全、便捷的绿色出行服务,在“共享电单车新赛道”中,始终把精细化安全管理作为核心竞争力,实现用户价值、企业价值和社会价值的统一。同时在城市拓展上,会从始至终坚持与城市共赢的原则,与各地政府主管部门合作,为城市做好绿色出行服务。
近日,滴滴青桔首届供应商大会暨桔无限联盟签约仪式在京举行。此次大会上,滴滴青桔与富士达集团、爱玛科技、雅迪科技、上海凤凰、绿源科技、禾苗通信、云伽智能、星恒电源、国轩高科、易事特集团等达成战略合作,致力于打造共享两轮行业的最高标准与颠覆创新。 此次参与青桔供应商大会的企业包括基础材料、物联网、整车制造等产业链关键领域的知名企业。本着平等合作、互利互惠、共同发展的原则各方将深入协同,寓“智”于“造",发挥各自优势,共同深入推进智慧两轮战略,促进全产业链效率升级。 整车全链路可溯化助力产业链升级 据介绍,自成立伊始,青桔一直致力于打造一个创新、低碳的大众普惠出行方式,力求向用户提供颜值高、体验好、兼具品牌价值的出行服务。过去三年,青桔作为行业后来者,通过持续的车型迭代和技术创新,赢得了市场和用户的信赖。通过与滴滴4+2的大出行生态相融合,渗透到越来越多元的出行场景。此次桔无限联盟合作将整车研发贯穿于产品全生命周期的各个阶段,通过标准化、模块化、智能化的升级,与各合作伙伴设立不同品类的统一标准,优化协作效率,提升各环节效率,实现多方共赢。 滴滴青桔CEO张治东表示,当前共享两轮出行已经进入3.0时代,作为共享两轮新时代新环境下的探索者和引领者,在共享两轮行业发展新的阶段,青桔率先提出用新的车体设计理念、可追溯的保养维修记录来承载不同的运营要求。通过严格把控从车辆设计、生产、运输、运维到报废循环中的每一个环节,能够实现“全链可持续”的管理实践落地。 科技进化两轮出行深化物联合作 滴滴青桔副总经理徐竹春告诉记者:“现代的共享两轮出行,是建立在移动物联网平台之上的。这是一个涉及设备接入、运维管理、大数据、算法、账户等很多维度的综合性智慧系统,通过移动物联网的方式,向用户提供出行服务。在这样一个体系中,我们希望技术能发挥越来越重要的作用。” 滴滴青桔推出的青桔智控中心,是利用人工智能、大数据、物联网等先进技术,为两轮车城市运营打造的基于数据驱动的智能决策系统,该系统以滴滴积累的海量出行数据和地图能力为依托,构建了基于时空的城市短途出行需求预测和智能调度能力,大大提升了C端用户和B端资产的精细化运营水平,实现了用户和资产的高效连接。 借助青桔智控提供的大数据运算和预测能力,平台可以分析和预测两轮车用户的出行习惯和场景偏好,利用多种运营产品矩阵提升对用户用车流程的智能干预。通过智能工单实现最优的“找车”“调度”“修车”“投放”等运营动作,在满足用户最佳的“易得”需求同时,实现资产运营成本的最小化。 寓“智”于“造”联盟助力产业革新 共享两轮业务的快速发展对供给侧带来了新的要求,产品和运营需求的不断细化,加速了传统制造企业的互联网化创新变革。通过生产智能化、网络化的共享单车产品,传统制造业对行业科技创新、质量标准有了很大的提升。 桔无限联盟的成立转变了传统企业间的供销关系,通过设计、研发、运营闭环的全方位合作,重塑行业发展模式。联盟企业将结合行业发展及趋势,共同挖掘、整合资源,推动产品的迭代,打造智慧两轮共同体。 青桔方面表示,面对共享两轮业务发展带来的新挑战,青桔将持续推进共享两轮行业智能化、精细化、系统化发展。未来不仅会延伸青桔ip化属性,同时会更细化拆分使用场景。此次桔无限联盟的成立将推动整体产业发展模式的变革,深化打造以用户为导向的产品架构,带动智慧两轮全产业链升级。
2020年,对大多数中国企业来说是改变轨迹的一年。新冠肺炎疫情席卷全球、中美贸易摩擦升级、中国互联网出海企业被美国“围剿”……震荡的局势造就了企业发展的分水岭。 在这特殊的时期,天九共享承办“2020中国独角兽嘉年华”,在其平台上接受孵化加速的34个项目集体启动了上市计划,不仅为当前的市场注入“新鲜活水”,并有效激活商业经济活力,助力经济企稳回升。 天九共享孵化加速的34个准独角兽项目集中启动上市计划 34个项目同日启动上市 天九独角兽加速器业界雄起 2019年11月,天九共享就已经启动了24个准独角兽项目上市计划。 8月18日,在天九共享29周年庆典上,天九共享再次传出让业界兴奋的消息——宣布集中启动34个准独角兽项目上市计划。这份骄人成绩,天九共享是如何达成的?这家企业缘何能破解让独角兽崛起的“核心密码”? 为独角兽整合全球资源是天九共享成功的关键所在。2019年底,天九共享顺应企业出海潮流,带领中国独角兽走出国门,亮相在维也纳召开的首届全球独角兽商机共享大会,同时帮助海外优质企业“落户中国”,成为中外企业合作交流的价值连接器。 2020年4月份,在经济亟待复苏的紧要关口,天九共享集团联合中国投资协会高新技术投资专业委员会,通过自主研发的“天九云洽会”在线商务系统举行了“第二届全球独角兽商机共享大会”,发布了10个全球范围内智慧新经济领域的前沿商机,在线上为中外商业交流开辟了新通 躬身入局 打造独角兽孵化加速器 对于过往成绩与经验,在天九共享集团29周年庆典晚会上,天九共享集团董事局主席卢俊卿坦诚指出,回顾我们刚刚走过的29年历程,天九共享取得了四个巨大成就,我把它概括为创造了没有边界的奇点式商业模式,打造了全球通O2O超级商务平台,创立了让奋斗者幸福的自运行管理体系,积聚了高层次、全球化的超一流创业团队。 天九共享集团董事局主席卢俊卿致辞 8月18日当天,有全国知名的华为云产品、中国移动咪咕公司、达闼科技等一批明星级独角兽企业、项目方与天九共享集团现场签约,携手合作,正式进入天九独角兽加速器。 据悉,天九共享正在加速的独角兽和准独角兽企业超过了300家,项目涉及人工智能、大数据、物联网、互联网+、区块链、新零售、新电商等众多新经济领域。 继往开来 持续践行企业社会责任 截至目前,天九共享集团举办了300余届中国独角兽商机共享大会,累计数十万位企业家出席,促成海量合作,孵化加速的新经济企业就已超过200家,帮助超过10000个传统企业通过抱团发展实现转型升级,促进就业超过20万人。推行候鸟工作制、终身员工制、祖业计划、企业家孵化器等特色制度,累计成功孵化出37位总裁、130位公司总经理、216名终身员工、150名员工股东。 天九共享集团全球CEO、苹果公司原全球副总裁戈峻展望道,天九共享集团将在2020-2021年,通过做好系统、做强孵化、做大平台、做实利润完成用户与项目的双轮驱动,并将在2022-2023年进一步完善形成用户、项目、品牌、资本四轮驱动的全球独角兽孵化加速器,进而成为帮助企业家达成梦想,为企业加速赋能的“森林型”企业。
隐私性跟可用性难以兼顾,让人工智能落入了鱼与熊掌不可兼得的尴尬境地。当前,业界解决隐私泄露和数据滥用的数据共享技术路线主要有两条:一条是基于硬件可信执行环境(TEE:Trusted Execution Environment)技术的可信计算,另一条是基于密码学的多方安全计算(MPC:Multi-party Computation)。针对数据共享场景,包括联邦学习、隐私保护机器学习(PPML)在内的多个技术解决方案纷纷出炉。蚂蚁金服提出了共享智能(又称:共享机器学习),结合TEE与MPC两条路线,同时结合蚂蚁自身业务场景特性,聚焦于金融行业的应用。究竟共享智能与我们熟知的联邦学习有何不同?在共享智能落地金融等多个重要领域的过程中,蚂蚁金服又遇到过哪些挑战,留下了怎样的宝贵经验?为此,雷锋网《AI金融评论》邀请到了蚂蚁集团共享智能部总经理周俊做客线上讲堂,详解蚂蚁金服共享智能的技术进展和落地实践。以下为周俊公开课全文,AI金融评论做了不改变原意的编辑:在业界做隐私保护技术研发之前,是通过协同学习方法来实现多方信息融合,联邦学习就是其中一种。近年来,学术圈相应的证明发现此类方法的一些安全性问题,尤其是直接共享梯度,本质上存在一些安全性问题。我们先来看一下去年在一个学术顶会上比较火的Paper引发的讨论。Paper里面的方法也比较好理解,实际上就是近几年大家保护隐私的方法之一:就是不传原始的数据,只传共享的梯度,把梯度汇聚到一起,然后再汇集到模型。这种方法在前几年一直都比较火,无论是联邦学习还是其他的协同学习方式。工作里面证明了,如果有恶意者在模型训练过程中拿到真正的梯度之后,就可以反推出数据中的特征(x)和标签(y)。这里举了两个例子,能够看到,尤其是在图像领域,通过梯度本身是可以反推出原始输入的这张图像和原始的Y。右边的例子,是在NIPS网站上抠的一些文字,刚开始是随机生成的,迭代到第30轮的时候,可以看到从梯度里恢复出来的一个样本,跟原始样本是非常接近的,只有个别词有一定差异。从学术上能够看到,在这种协同学习中,以前大家认为安全的共享梯度方式,本身并不是很安全,我们给它取了一个标题叫做非可证安全。在这之后,DLG方法有了改进。这个方法首先通过推导可以精确拿到Label本身,有了Label再去反推X就更简单了。从公式可以看到,它能更容易反推出原始数据的X。从它的三个数据集可以看到,改进版DLG相对于原始的DLG在攻击的准确率提升非常大。阿里巴巴在去年也做过一个更加贴合实际情况的例子:假定双方有两个数据拥有者,它们的特征空间一样,样本空间不一样,我们称之为水平切分。按照联邦学习的协作方式,计算本地的梯度,发到服务器,平均之后更新本地的模型,看起来比较安全——实际上,由于A和B精确知道每一轮梯度,它其实可以反馈出很多相关信息。满足一定条件的情况下,尤其是逻辑回归,可以构造出这样的一组方程组,当方程组的个数大于这个数据的特征维度,方程组是可以解出来的。因此也可以反推出原始的数据。从右下角的结果中,能够看到我们攻击出来的结果,跟原始特征非常接近。这说明,不论是从学术圈里面假定的setting,还是真实情况中,目前这种共享梯度的协作方式,也包括联邦学习,本身都有比较大的安全隐患。做保护隐私的机器学习方法,本身还是需要结合其他方法去弥补它的不足,才有可能让方法本身更安全,真正保护用户隐私。如何“精修”机器学习处理方法各环节数据预处理:我们自己所做的机器学习处理方法,从数据预处理到模型训练再到模型推断,都是遵循这样切实保护用户隐私的思路,将MPC、TEE或其他技术,跟现在技术相应结合,确保中间每一步的隐私都能得到更好地保护。以数据预处理中的降维为例,假定数据在水平切分的情况下,大家样本空间不一样,两方希望能够把数据能降低一个维度,降维之后的结果能够送到后面的机器学习模型进行相应训练,这种方法能较好提升效率。同时,模型的泛化能力会有进一步提升,结合MPC里同态加密和秘密分享的技术,加固PCA(Principal Components Analysis,主成分分析),使得它能真正保护数据安全性。此处有几步核心操作:首先是计算均值。如果是在同态加密的情况下,需要密态空间要进行计算;如果是秘密分享的方法,则需要将原始数据拆成多个秘密分片,再配合起来算出均值。其次是计算协方差矩阵,最后再算出相应的特征值、特征向量,就得到了降维后的X′。同态加密和秘密分享的技术,跟PCA做相应结合,就能比较好的拿到相应结果。从结果可以看出,相比于各方单独算一个PCA再拼凑结果,我们的方法精度提升比较大。同时,它跟原始PCA方法相比,在后面都接相同的机器学习模型的情况下,几乎没有精度损失的情况。除了降维以外,还有很多类似的工作可做,比如共线性检测,隐私求交(PSI)等。当然,安全的方法计算时间会更长一些,因为天下没有免费的午餐,要保护隐私,肯定有相应的计算和通信成本在里面。模型训练:DNN模型是现在大家用的比较多的。这里分别列出来业界三种典型做法。左边是传统的基于明文的神经网络训练方法。中间是完全基于MPC的方法,有很多非线性运算,可以做到可证安全,但速度会慢几个数量级,效率本身也不高。右边是MIT提出来的方法,比较快,但它的Label也放在服务器里计算,安全性有一定问题;而且它没有考虑特征之间的相关性,精度上有一定损失。发现这些问题之后,我们提出了一个创新的体系。首先,为了考虑特征之间的相关性,我们在底层利用MPC技术去做跟隐私数据相关的一部分模型计算。计算完之后,再把跟隐层相关的复杂计算,放到一个Semi-honest 服务器(半诚实服务器)去完成其他运算。这服务器里可以利用现有的各种计算资源,比如TF、PyTorch,甚至可以利用一些比较灵活的处理框架。Label的部分还是放到数据持有者本身,全程能确保没有哪一部分隐私会被泄露。Semi-honest 服务器会拿到中间的隐层结果,我们可以通过一些对抗学习方式去防止服务器获取中间信息。这一方法尽可能做到隐私、准确率、效率三者之间的平衡。此外,我们还可以使用贝叶斯学习的方法(SGLD)去替换传统的SGD(随机梯度下降),从而更好保护训练过程中的隐私。SGLD是在贝叶斯神经网络中应用较广泛的方法,可以看作是加噪版本的SGD。以前很多方法都在探讨它的泛化能力,在这里我们发现了它另外的好处:因为训练过程中添加了噪声,所以可以更好的保护隐私,尤其是在对成员攻击(Membership attack)的情况。比如有时医疗领域想知道自己的数据有没有被这个模型所用。我们在评估Membership攻击效果时,定了一个成员隐私的loss,这个loss就是为了看SGLD到底能不能保护成员隐私,我们通过大量的实验发现SGLD是能较好阻止Membership attack。具体来讲,我们在两个数据上面做了相应的测试,无论是在Table1还是在Table2里,尤其是在Attack Metric上,SGLD跟普通的方法相比,能够大大降低成员攻击的准确率。同时,我们也发现用它也能很好提升模型的撸棒性,SGLD和变种,比前面单独的不加噪版本在Test上面的Metric会更好一些。因此,我们在训练时也把传统的SGD换成了SGLD,能进一步提升安全等级,在兼顾三方面要求后,具有比较高的安全性和高效性。刚才讲到,在服务器里,可以很好利用现有的TensorFlow或Pytorch,从右边这个代码可以看出来,该方法是非常用户友好的。其次,在服务器里面,对于网络结构这部分,设计可以非常灵活,也可以设置任意的网络结构,充分发挥中心服务器的计算力。通过训练过程中引入的SGLD,也就是加噪的SGD,再加上Adversary loss,使得哪怕是服务器试图做恶,也无法由此推断出更多相应信息,安全等级进一步提升。我们跟业界的几个方法也对比过,比如2017年 MIT的 SplitNN和现在最好的SecureML。性能上,(我们的方法)比这俩更好一些。从这两个数据集来看,训练时间上,由于我们使用了中间服务器,训练时间相对于纯MPC的方法(SecureML)大大降低,但相比SplitNN训练时间还是要长,因为我们安全等级要高。总体而言,我们的方法能较好地实现效率、安全性和准确率的折中。模型预测:在模型训练上,涉及到前向、反向的计算,非常耗资源,它跟现有的一些隐私计算技术结合之后,对效率本身还是有比较大的影响。所以有很多工作都在考虑怎么做模型推理。在模型预测时,既要保护云上的模型,也要保护客户手里的数据。我们这个方法跟原来不一样,之前可能有很多工作局限于支持一部分的激活函数。比如有时都无法支持sigmoid或max pooling,有的干脆只保护客户端的Input data,但不保护服务器上的模型。还有极端情况是完全用MPC做计算,单次模型预测用时会非常长。另外,现在MPC尚不能完全精确计算一些比较复杂的函数,只能做一些展开或近似计算,精度上也有所损失。我们希望能够提出一种方式,尽可能在效率、精度、安全性方面能达到比较好的折中,保护服务器和用户的隐私。方法采用了两点,一是前面介绍的贝叶斯神经网络,因为它里面可以引入权重的不确定性,这能让服务器上的精确模型不被拿到。第二,无论是在数据保护还是在客户端上,用同态加密的机制去保护。具体是把DNN的计算拆分成两级,一是首先通过采样的方法拿到W,有了W之后,客户端传过来的加密Input,通过线下的运算出Z,这也是密态的。密态下的Z在返回到客户端解密后,在客户端上就能拿到最后的a。这样的方式,既保护了服务器上的模型,也保护了客户端上面输入数据的效果,起到了比较好的trade-off。通过迭代式的同态加密计算,既保护了用户隐私,也保护了密态下的服务器隐私。我们的方法,因为大量的复杂运算很多是返回到客户端上面,在非密态的情况下进行计算,所以Latency比较低。它还能支持任意的激活函数,可以比较好地扩展到RNN和CNN。典型应用案例:POI上的推荐原来的做法,不论是非常详细的profile数据,还是一些用户跟POI的交互数据,用户的所有相关数据都要被推荐系统所收集。一些隐私模型,比如用户偏好也都是被推荐系统所保留。所以推荐系统有很大的机会窥探到用户相关隐私。我们的思路是:首先,比较敏感的用户隐私数据和模型,能够在用户本地,而不能上传到服务器的推荐系统这里。第二,我们还是会收集用户和POI的交互数据,通过本地化差分隐私的方式注入噪音,这样传上去的是一个带噪音且能够保护隐私的版本。通过这样的方式产生动态的POI,再通过去中心化的梯度下降方法学习能保护隐私的FM模型。通过各式各样的安全聚合方式使隐私得到保护,这种方法我们称为PriRec。我们在两个数据集上做了比较,在Foursquare数据上,因为用户特征只有两三个,我们的方法比FM稍弱;但切换到真实的场景数据,因为这里面有大量的用户和POI数据,能看到我们这个方法比FM起到更好的效果。之所以会更好,原因就是用户和POI的数据,往往具有聚焦性,而去中心化的学习方法恰恰可以很好的利用这一点。在PriRec中,服务器上也没有拿到隐私的数据和模型,所以能保护隐私。实际上,推荐搜索广告方面都有类似应用;金融科技领域的风控也有类似的方法,就是对现有的机器学习方法进行加固,产生一个更好的、更具有隐私保护的版本,达到AI助力业务效果的目的。目前业界的四种技术包括MPC,可信执行环境,差分隐私和联邦学习。在多方安全计算时,理想情况是有一个大家都完全相信的可信服务器,所有人把所有东西都放上去计算,再把结果分发给大家。现实是找不到完全的可信服务器,还是需要很多协作方,协同完成函数f的计算。当然,大家希望在计算的过程当中既能够保护Input privacy,也能够保护计算的privacy,如果同时能保护Output privacy最好。MPC的提出,是希望能够保护Input privacy和Compute过程当中的privacy。这里面有几个典型技术,一是秘密分享(Secret Sharing),密码学里一个比较老的技术。早在七八十年代就已经有相应的论文发表。举个例子:有两个人想协同计算他们求和的结果,每个人会把自己的数拆成多个share,share加起来等于他们自己,但任何人拿到其中一个的share是没有什么物理含义的。通过share的交互,双方最后拿到7和6的结果(上图右侧),这其实已经完成加法的求和运算,既保护了Input的隐私,也保护了中间计算的隐私。这几年在工业界里,随着算力的丰盛,以欧美为代表的很多公司都在用这样的技术,比如著名的开源SPDZ等。二是姚期智院士在1989年提出来的混淆电路。它主要是通过两个大的building block构建,一个是混淆的真值表,一个是遗忘传输,通过这两种方式完成协同计算,解决了著名的百万富翁问题。秘密分享因为它需要通过大量交互迭代,通信代价一般较高。混淆电路中间是通过大量电路运算,电路的门个数较高时,效率相对来说没有那么高。其次还有同态加密方法,过程中是在密态下计算完的,之后才解密得到相应结果。同态加密和秘密分享在一些比较复杂的函数上,是没有办法进行相应计算的,要通过一些近似计算的方法才能拿到相应的结果。由于算力的逐步提升,和一些基础突破,这两年工业界对MPC也用得越来越多。三个技术有各自的优缺点,组合使用也能产生一个相对理想的结果。可信执行环境,相当于是一个硬件级的密码箱。把加密数据放到密码箱里之后,OS操作系统都没有办法打开密码箱,只有持有相关密钥的人才能在里面进行运算,就是所说的可信区域。这个方法本身是非常安全,但很依赖于硬件,目前做得比较好的是因特尔的SGX。前面所介绍的 MPC、TEE,都是可以保护Input privacy和compute privacy ,但没能很好地保护output privacy。在差分隐私(Differential Privacy)之前有很多别的方法去处理数据中的隐私,比如像各种匿名化方法,除了K匿名,还有一些L-diversity等方法保护隐私。但随着大数据时代的到来,通过链接一些别的数据,能够反推出来单人ID,匿名化基本上没有什么用。所以差分隐私之前的一些技术,现在来看是不安全的。对Output或Release的数据集,都在慢慢切换到差分隐私的技术上来。这个技术本身较好地考虑到实用性和隐私性的折中,隐私肯定有代价,要么牺牲一定的实用性,要么有计算代价。差分隐私是在数据中加噪声,对实用性有所影响,尤其是在数据本身也不大的情况下,对结果的影响较大。差分隐私提供了一种量化的方法,能测量到底加多少噪声,能够取得比较好的trade-off。差分隐私从从概率学和信息论得到一个隐私保护的bound,实操不是很复杂,就是在数据中添加相应的噪声,并且通过参数控制噪音的大小。当然,它本身怎么使用、怎么设置privacy budget,有着非常复杂的考量机制,但原理本身不算特别复杂。这个技术在提出来之后,因为它有比较好的理论保障,所以在学术界、工业界很多人也都在用,能比较好地保护Output privacy,跟前面的技术也有比较好的结合。Local 差分隐私类似多方,就是自己本身加上噪声,再上传到一个地方。它在工业界遇到的一个较大问题是,因为要在里面加噪声,所以模型精度受影响。 联邦学习,谷歌在2014年就已经在内部开始做这样的技术,它本身是解决to C的问题,所以想解决几十亿的设备间如何协同、安全地利用数据训练模型。当然设备之间可能不满足独立同分布的概念,硬件之间差异非常大,所以会导致可靠度的差异也很大,有时在训练的时候自己就下线了。在2016-2017年,联邦学习有相应论文发表。目前用的算法也是从服务器上拉了一个模型,做完更新,delta发给服务器做average并更新模型。直接这么做肯定会有一些问题,所以paper里面做了大量的优化,能够让通信成本和训练的稳定性都有比较大的提升。谷歌在2017年期间已经发现了,原来把梯度直接汇聚到服务器上的协同学习方法也不是很安全;如果要保护隐私,必须得结合MPC的技术。几种技术的比较和解决方案我们从自己的角度做了一张总结表格,像MPC能保护好Input privacy和计算过程中的privacy;但对于Outputprivacy,它的保护能力比较弱。效率上,因为牵涉到大量密码学技术,代价不低。TEE跟MPC类似,把它们理解成密码学偏软件和偏硬件的实验版本。差分隐私就可以较好保护Output privacy,计算代价相对不高,实用性有一定损失,尤其是local 差分隐私加了某种噪声之后,只能用于某些统计学运算。联邦学习无法很好地保护Input privacy和Output privacy,好处在于效率相对高。站在从业者的角度来看,这些技术还是需要一个端到端的设计,结合各方技术优势提供相应的方案,达到最后总体的效果。我们结合了这样三个方案:首先,MPC底下分为这么几层,用前面所讲的秘密共享、OT或其他密码学的原语。为什么要实现这么多密码学的协议?就是希望能够利用每种协议的优缺点,有更加好的组合,在合适的地方选用合适的技术。第二层,我们希望把底下比较偏密码学的原语,再做一层封装,这上面提供一些机器学习经常要用的运算,比如比较、求交、矩阵加法、求max的运算。上面再抽象成一个DSL语言,开发算法时,不用直接面对底层密码学原语,速度相对会更快。另外,因为我们参考的是机器学习里面的DSL,整个语法也跟机器学习类似,机器学习的创业者就能用比较低的成本,切换到共享智能技术上,进行算法开发。同时,我们也提供编译器,它能够将用户对上层开发的算法,自动选择最优的安全算子,实现安全的程序,进而实现整个MPC里面的一些方法。TEE方面,因为TEE本身的SDK也不是那么友好,并且单机的SGX的运算能力并不是特别强,为此我们做了一些改进:组建安全可信集群,以扩展算力;做了很多防止各种攻击的方法,在安全性上有个更好的工业级框架出来,便于开发者能够基于这些核心能力开发出各种算法。上面是比较偏差分隐私或矩阵变换的方法。这种方法还是有比较好的适用场合,比如前面讲的Output privacy里面用到差分隐私,或者是MPC和TEE里面在Output 的地方加上差分隐私,本身有比较好的互补的作用。技术之间也可以两两去组合。每个方案都有各自的优缺点,做隐私保护相关的工作,还是需要通过精心的工程设计,算法设计加上密码学原语,才能够端到端地保护数据输入、计算过程、数据输出等隐私,从而达到相应的目的。蚂蚁共享智能的落地经验合作案例:江苏银行去年上半年,江苏银行希望使用MPC实现联合风控,模型的产出完全放在江苏银行,自主可控。构建出联合模型之后,模型分数给到银行,由它去做独立的风控判断,之后再产生结果给到最后的申请判断。整个模型的效果在测试的时候发现提升了50%左右。同样,我们还在支付的联合风控、联合营销以及联合保险也进行了相应的落地。AI研究前沿动态和未来展望目前看来,现在这几个技术之间彼此有互补,但端到端的系统怎么在各个环节去利用合适的技术,去产生合适的效果?怎么样把这样一个系统在超大规模的数据上做相应的实践?在不影响效率的情况下,将隐私保护的等级能够升级到更高的级别?我觉得还需要有整个业界需要投入更多的资源,更长的研发投入,更长的耐心,才有可能在一些更关键的技术上面产生更好的结果。同时也需要整个AI圈子加上密码学的硬件再加上工程系统,一起努力才有可能在一些点上面取得真正的大的突破,才有可能使得整个隐私计算的效率能够再提升1~2个数量级。目前隐私计算效率本身,相比非隐私保护的AI,在速度甚至精度上都会有一定的损失。所以,怎么样去设计更好的方式,除了在技术本身的突破,也需要有更多的场景去打磨技术,才能发现的问题,逐步让技术往前走。从三大维度来看:第一,从算法维度看,无论是在学术界还是工业界,目前的这几个方法割裂程度比较明显。比如TEE跟差分隐私,虽然他们之间有交集但并不多。TEE里也有很多技术要去突破,比如目前TEE的内存只有128兆,相比普通系统还是比较小的。现在数据量比较大,尤其是在一个图像数据上,怎么在这么大的数据情况下完成隐私计算,是难度比较大的一个问题。第二,由于内存比较小,为了保护安全和隐私,所以在很多运算效率跟目前正常操作有一定差距。第三,SDK的友好性方面,因为比较偏硬件,还涉及到大量的密码学等机制,比如远程认证,对于很多从业人员而言还是有相应的学习成本。当然,业界很多开源的、在原生的TEE上封装的一些SDK,各方面有一些提升,可扩展性本质上有些突破,但突破不是特别大,意味着很多东西不能拿来直接在工业界使用。所以TEE也还需要整个社区有更多的投入。TEE上面,现在很多都在做支持中小规模的算法训练和预测。怎么让更大的规模、更新的算法能够被集成进来,这也是需要业界有更多投入。差分隐私技术本身的理论性质比较优美,但在实用性上有一定损失。我们提到过,对于utility loss以及差分隐私输出来的结果,因为毕竟是在原始的数据上面加了一定的噪声,这个数据相对来讲会不会有一定的损失度?如果完全是local 差分隐私的方式,在很多场景下面就没有办法用,怎么让差分隐私能够再更进一步,更贴合现在AI这个情况?目前看到,差分隐私在很多数据分析应用非常广泛,比如,苹果系统上收集了emoji的数据;微软操作系统的浏览器里面也嵌入了差分隐私的数据;Uber也用了这样一个技术,但目前大部分用在数据统计方面。怎么样把差分隐私这样的技术能够跟AI有更好的结合,是未来一个比较大的突破点。MPC技术本身,从经典论文发表来看,虽然不算特别新,但在很多很复杂的运算上,尤其是在AI的一些新方法,MPC效率本身还是有一定的代价。怎样取得算力的增长,有新模式突破,像完全同态的方法什么时候真的变成实用,怎么能够使这个技术在工业界更进一步,这也是需要考量的一个点。联邦学习目前也存在一定的安全隐患,四个技术之间怎么去做相应的结合,取长补短,能够形成比较好的下一代的解决方案,真真正正保护隐私,让AI落地变得更简单?尤其是在一些数据比较敏感的地方,像医疗的某些领域,病例的数据采集特别困难,真的能够让AI进到这些地方,辅助决策,才能更加好实现社会意义和价值。我觉得,在算法层面会需要深度结合,无论是基于某些算力,还是说在技术领域的突破,能让这里面的一些问题有更进一步的解法。在平台层,无论是差分隐私、TEE还是别的技术,越靠近数学和越靠近密码学硬件,为了保护隐私,里面大量的设置都比较难以理解。怎样让大家更高效产出不一样的算法,降低使用门槛,这些方法才能够跟更多地方结合,产生更多的新突破。在DSL和在编译器方面,甚至在整个系统的运维、部署,以及系统稳定性、安全生产等各方面,有没有进一步的突破,变得易用?在一些对时效性要求没有那么强的情况,如果能够持续稳定计算,对于很多产品也是比较适用的。对于整个隐私计算领域而言,这也是一个巨大的挑战。所以怎样有更高效的平台一体化设计,让使用门槛变低,才有可能会真正带来一些繁荣的社区,让技术能够走进更多场景、更多机构,真正产生一些化学反应。
王鸿8月11日-12日,第四届地新引力峰会于上海宝华万豪酒店举行,地产、资管、物业、租赁、产业、科技、金融、区块链、文旅等行业领袖齐聚,思考特殊时期的破局之路,探寻地产的第二增长极,全程直击。现场直播》》 湖南链城基金公司总经理、娄底市区块链办执行副主任谢纬表示,从2018年3月份开始启动了娄底市不动产区块链信息平台项目,把政府有关不动产数据和金融机构和不动产相关的数据以及个人愿意提交的数据,整理成一个关于不动产产权本身以及不动产产权相关人的电子凭证,在2018年11月12日不动产信息共享平台上线,同时发布全国首张区块链不动产的电子凭证,到今年通过,非常漫长的过程让这个凭证逐渐在金融机构和所有社会管理机构包括碰到公共服务机构、自来水、电力、煤气去流转。 未来在所有政府机构办事,在所有公共服务机构不再需要任何纸质的东西凭一个证甚至未来通过刷脸直接办手续,也不需要再去核实所谓提交的纸质材料,都是通过区块链网络自主核对。 通过一系列工作发现由于数据在链上进行交互解决一个很大的一个问题,企业和企业之间感觉存在竞争、不信任。关键的问题在于每一个系统都有内控体系,都需要确认、防范风险,但是防范风险导致整个社会成本大幅度上升,不只在房地产企业,在房地产企业在金融机构之间,在金融机构和房地产企业以及政府之间,以及和老百姓之间都存在巨大的浪费,这个也是在区块链在整个上链不上链体现巨大的差异。 他认为区块链改变的是思想,最大变化从原有中心化共享模式转为分布式的共享,这个体系为什么存在孤岛,存在大家非常高昂的信任成本也在于此。 他希望不动产区块链共享平台是一个基础设施,是数字化的基础。只有把政务数据体系和金融数据体系以及社会中介数据真正在链上进行共享融合,不动产数字化未来才有更清晰的展示。
二季度美国GDP暴跌32.9%,创下1940年以来最大下滑记录。 在特朗普有力的防控之下,美国疫情感染人数已经超过500万,高速蔓延趋势不减,经济重启的脚步一慢再慢。 借助政府的正确指导,上半年美国迎来一大波破产潮,幸存的企业也大多艰难度日,当然其中也不乏趁机上位的勇士。 而这轮危机中,昔日备受追捧的共享经济明星公司显然没能扛住生活的毒打。 Uber亏损继续,外卖业务撑起一片天 日前,Uber发布了二季度财报。 整体上,Uber营收22.41亿美元,同比下降29%;归母净亏损17.75亿美元(约合人民币124亿元),其中包括1.31亿美元股票薪酬激励费用以及一次性业务重组相关的3.82亿美元费用,相较去年同期的净亏损52.36亿美元,同比收窄66%。 数据来源:Wind 不出预料,还是一如既往地亏损。 虽然市场早有准备,但亏损程度还是超出预期。财报发布当日,Uber股价盘后一度下跌近5%,第二天低开收跌5.21%。 行情来源:Wind 运营方面,Uber二季度预定量为102.2亿美元,同比下滑35%。具体来看,出行业务进一步萎缩,订单额只有30.5亿美元,同比下滑73%;而另一边外卖业务却在疫情期间快速增长,Uber Eats食品配送收入69.6亿美元,同比增加113%,超出此前预期。 原因也不难得出,疫情严重,出行通勤受阻,加上民众经济水平也大幅下降,打车的需求锐减,外卖则从一种“奢侈”变成了“必要”。财报中披露,Uber第二季度月度活跃平台消费者人数为5500万人,同比下滑44%;总出行次数为7.37亿次,同比下滑56%。 数据来源:公司财报 如果单从数据上来看,短短不到半年时间,上市之前还是全球估值最大的共享经济独角兽被迫转型成了一家外卖公司。去年二季度,Uber的外卖业务收入仅占总营收的21%,现在这一占比达到了68%,同时出行业务大幅腰斩,从77%的占比掉到30%。 疫情期间,外卖业务帮Uber回了一大口血。从Uber的动作来看,是打算把它做成和共享打车一样的核心业务。 2019年Uber Eats的市场份额从22%下降至19%,在竞争中被DoorDash甩在身后。而借着在线点餐因为疫情的猛增,Uber Eats迅速扩张,占据24%的市场,还在7月初以26.5亿美元全股票交易方式收购了Postmates,份额来到32%。 数据来源:Second Measure 或许,Uber还是很想转型做外卖的吧。 Uber:我们只烧钱,从不盈利 尽管Uber的外卖业务做得风生水起,盈利能力还是没能摆脱共享业务的阴影:收入69.6亿美元,EBITDA(息税前利润)为-2.32亿美元。 一部分是因为Uber Eats承借公司网约车的优势,在此基础上以“平台+配送”的重资产模式(类似于美团)切入外卖赛道,虽然因此得以一举赶超曾经的行业老大哥Grubhub,但烧的钱也不少。 另一方面,外卖平台严重依赖佣金收入、盈利模式单一,这也是Uber搞外卖的硬伤。以美团为例,一季度其餐饮外卖业务收入为94.9亿元,仅佣金收入一项就高达85.6亿元,占比超过90%。 不过,相比去年同期,Uber的外卖业务盈利情况还是有所好转。另外,在收购Postmates之后,Uber Eats的市场份额稳居第二,加上前者的技术和雇员很可能会被用于配送食品、杂货、药品、家庭用品、设备以及包裹等各类服务,外卖业务将来挣钱几乎没有多少疑问,就看Uber的心有多大了。 图片来源:Uber平台 问题还是在打车业务上。 2009年成立至今,Uber一共融资247亿美元,而现在它账面上现金余额只有81.01亿美元,也没有什么其他资产,也就是说,如果不考虑业务运营的收入和其他影响因素,这11年来Uber烧了160多亿美元。 数据来源:Crunchbase 搞共享的烧钱理所当然,但令人费解的是,2012年成立的滴滴烧了几百亿,终于在8年后宣告盈利,而早它3年时间上线的Uber到今天还在泥潭里挣扎。排除疫情的影响,上市以来Uber都没能实现反转,2019年最高亏损达到90亿美元,唯一一次季度盈利还是因为卖东南亚和俄罗斯的业务得了30亿美元。 数据来源:Wind 故事讲的好,资金随便搞。Uber的共享故事一向能够收获资本的追捧,现金流上没什么问题,光账面上的资金还能亏上整整一年。 数据来源:Wind 有钱作燃料,用户会增加,市场会扩大。2019年Uber的月活跃用户突破1亿,虽然现在只剩下5500万,除了亚太地区,美国、加拿大、拉丁美洲、欧洲、中东、非洲地区都在下滑,但毫无疑问,这是暂时的,剔除黑天鹅的冲击,长期的增长趋势不会有太大问题。 但这种共享出行模式的盈利能力瓶颈去难以解决。二季度,出行业务收入30.5亿美元,EBITDA(息税前利润)仅为5000万美元。 搞了11年,就这? 共享经济真不抗揍 因为美联储空前大放水,Uber的股价从3月份开始回升,但对这种共享经济模式的怀疑声从来没停止过。 数据来源:Wind 没办法,谁让这些搞共享的独角兽都集体扑街了呢。疫情一爆发,爱彼迎、Lyft、WeWork这些明星公司无一幸免,亏损、裁员、撕X……歌舞升平年代隐藏的问题一股脑地全蹦出来饿了。 归根结底还是共享经济太脆弱、不抗揍。 共享的本质是整合线下闲散的人力、物力,提供给具有短期使用需求的用户。 换句话说,共享经济干的是中间商的活,联通买家和卖家,完成需求和供给的配对。 所以,这种模式走的是轻资产扩张的路,不需要自己买房买车,重要的是覆盖足够多的用户,形成规模效应。也因此,所有玩家的玩法从来都没区别:“融资——烧钱——培养用户习惯——跑马圈地——占领市场——赢者通吃”。 于是,问题来了。 共享经济靠着画饼烧钱来完成巨头的垄断,但这种垄断的基础是非常脆弱的,小黄车可以做共享单车,摩拜也可以,哈啰也行,除了背靠的资本实力外,谁也不比谁更有优势。 因为是共享,客户粘性差,早期都是靠着高额的补贴俘获供需双方,从而累计从业者和消费者,哪家的补贴力度大哪家扩张就快。 所以不但要烧钱,还要不间断地烧钱,不间断地融资(除非你家里有矿),融资就要讲好故事、让投资者看到用户量数字的增长。其中任何一个环节都不能断,断了,这家公司就死了。 轻资产的经营模式造血能力不强,共享经济尤其如此,市场格局还没成熟前业务的盈利能力几乎可以不计,而只有烧钱烧到最后,才能赚钱,这其中任何一个不确定因素都可能成为死亡的导火索。小黄车不就是个最好的例子吗? 尾声 “Airbnb自己没有一间房,却成了一个跨国酒店集团”。 这个故事被讲地太好了,以至于很多人都忘了它连续烧了10年的钱,并且幸运地没有遇到什么阻碍。 各种共享模式轮番出现,单车、雨伞、充电宝……倒下了一个又一个,依然还是前仆后继,但摆在这些共享玩家面前的问题从来没变过:如何盈利? 靠着原始的资本火拼,共享经济走完了上半场,下半场呢?
7月30日,哈啰出行“科技美好你的出行”首届科技开放日活动在上海举办。 哈啰在此间公布三大成果:联合中国联通、紫光展锐、广和通三家企业共同宣布率先在哈啰共享两轮出行服务中应用4GCat.1通讯网络;与上海联通物联网研究院共同发布《共享两轮物联网技术的应用、演进及其生态价值》白皮书(下称“白皮书”);首次公开展示与千寻位置共同研发的“车辆高精度定位及电子围栏停车技术”。 此外,白皮书显示,目前中国自行车社会保有量已近4亿辆、电动自行车近3亿辆,堪称“国民出行工具”,按目前共享两轮行业发展速度及中国总人口需求评估,共享单车未来总数预计达到3000万辆。 哈啰出行副总裁任亮亮介绍说:“作为物联网技术应用规模最大的一个行业,共享单车和公共助力车迁移4GCat.1网络将极大提升用户体验以及丰富用户使用场景。” 据了解,首批1500辆搭载4GCat.1bis模组的哈啰助力车已于今年7月投入使用,搭载4GCat.1bis模组的哈啰单车也将于今年启用。这是共享两轮出行第一次应用Cat.1通讯技术,也标志着共享两轮出行大规模迈入4G时代。 紫光展锐工业物联网副总裁鲜苗指出,紫光展锐推出的全球首款Cat.1bis芯片——春藤8910DM很好地承载了存量物联网业务的迁移,填补中速率场景空白,为包括共享单车在内的多样化场景提供优异的覆盖和连接速度。应凌鹏则认为,Cat.1模组在今年走入众多领域,共享单车是喝到头一口汤的行业之一。 联通(上海)产业互联网有限公司总经理姚健表示,作为物联网技术应用规模最大的行业,共享单车行业在定位、物联网传感器、通讯、物联网相关的云服务等方面显著带动着物联网上游生产制造领域的发展,每年带动物联网相关产业产值上百亿元。作为城市交通基础设施中最后1-3公里的慢出行系统,当前共享单车行业已经进入用户、城市、管理者全生态友好的新阶段,共享单车的停放规划预计将成为不少地方城市升级改造计划中的重要部分。任亮亮此间透露,目前哈啰出行注册用户已超过4亿。 白皮书指出,经过数年快速发展,共享两轮逐步成为人们生活中不可替代的中短途出行方式。自2014年起步至今,共享两轮已历经了数次发展模式与技术的升级迭代,大浪淘沙之下,行业已告别粗放竞争,格局逐步清晰,进入理性发展阶段。