一则报道引发的年报更正公告,暴露出同兴达信息披露混乱的冰山一角。 6月10日,上证报以《行政人员人均年薪百万,一朝降薪八成,这家上市公司薪酬玩起过山车》为题的报道,指出同兴达行政人员薪酬异常。对此,同兴达公告称,公司2018年年报存在数据错误,即年报披露的不是真实情况,从而导致报道“不属实”,并对该年报数据做了更正。 然而,记者发现,更正后的同兴达行政人员数量、平均薪酬水平,与公司当年财务数据存在明显矛盾——前两者相乘得出的行政及财务人员薪酬总额,远高于管理人员薪酬总额。按常识,管理人员薪酬总额应该包括行政及财务人员薪酬总额。 换言之,为了掩盖数据异常而修补更改,反而更衬托出公司财务数据的不可信。 真实,是上市公司信息披露的底线。如果年报数据说改就改,改了还错,其问题就不仅是疏忽、致歉这么简单,否则所有财务造假都可以一改了事。数据打架、前后矛盾之下,同兴达的财务数据有几成是真实的? 记者调查发现,同兴达的问题不止于此。千里之堤,毁于蚁穴。当一家公司用错误掩盖错误,将盈利依赖于补贴,把希望低价位让利于关联方,包括监管机构在内的市场各方应以更加谨慎的眼光来审视它。 人数越描越黑 同兴达信披问题频出 翻阅同兴达近三年财务报表作研究,竟发现其2018年报披露的数据存在异常,通过计算得知,公司2018年普通行政及财务人员年薪百万,跟前后年度差异巨大,报道刊发后,引起市场热议。 6月12日晚间,同兴达对此予以回应,公司给出的解释是,年报数据写错了。 当晚,同兴达更正了2018年年报,并表示,“截止(应为‘至’)2018年末,公司行政人员数量为465人,财务人员25人,大于2017年,小于2019年。根据2018年行政人员及财务人员平均人数进行测算(不包括公司董事、监事、高级管理人员),行政人员及财务人员2018年平均年薪为21.31万元,薪酬合理。” 这一解释看似合理,但简单计算却可以发现,与财报其他数据却对不上了。 按照更正后数据,同兴达行政及财务人员合计490人,剔除董监高合计12人,普通行政及财务人员478人,其2018年人均年薪21.31万元,两者相乘可得出,行政及财务人员2018年薪酬总额10186.18万元。 然而,更新后的2018年年报显示,管理人员薪酬合计8042.37万元,剔除董监高薪酬1116.34万元,行政及财务人员当年薪酬总额合计6926.03万元。 显然,仅“行政及财务人员薪酬”这一项,公司在一份年报中就存在明显矛盾,两个口径的统计差额高达3260.15万元。 对此,同兴达董秘李岑对上证报解释,行政及财务人员的数据,是截至2018年底的时点数据,而普通行政及财务人员2018年人均薪酬21.31万元,是这一年的区间数据。2018年,同兴达因为人员流动较多导致上述差异。 上述解释乍看似乎也解释得通。但对比同兴达同期其他类别人员数据变动,就显得行政人员飙升的突然突兀(见表格)。 比如,2018年公司销售人员,从2017年64名突然减少到2018年的34名,财务人员2018年人数比上年仅增加1人;但行政人员则突然从160人飙升到465人。 一家上市公司的普通行政及财务人员薪酬总额出现3260.15万元的差额,却归因于人员流动过大,这背后究竟想掩盖什么问题? 记者在猎聘等招聘平台上看到,南昌光电(现已是控股子公司)招聘人力资源规划师开出年薪7.2万元至9.6万元,绩效专员的年薪在4.8万元至8.4万元。假如以行政人员年薪10万元计算,要想解释3260.15万元差额的合理性,同兴达需要让300多人在2018年年初入职,到该年底又离职。 只是,2017年至2018年同兴达即使有扩张,也不至于要将大部分普通行政及财务人员大换血? 同时,同兴达以“年报个别数据有误”为由变更2018年年报,已经暴露出上市公司信披瑕疵。而上证报记者通过调查发现,同兴达信披不仅存在瑕疵,甚至存在信披违规嫌疑。 2019年12月9日,同兴达复审通过深圳市科技创新委员会、深圳市财政委员会、深圳市国家税务局、深圳市地方税务局联合审核的高新技术企业认定,自2019年至2021年,按照15%税率征收企业所得税。 一位业内人士分析,上述事项属于《上市公司信息披露管理办法》中“获得大额政府补贴等可能对公司资产、负债、权益或者经营成果产生重大影响的额外收益”的情形,需要及时公告。 但是梳理同兴达公告可见,同兴达未能及时公告上述事项,仅在2019年年报中略有提及。 去年盈利靠政府补贴 子公司引入关联方惹争议 如果仅关注营收、归母净利润两个指标,同兴达过去3年的表现颇为正常,可稍微挖掘一下公司的主营业务盈利能力,记者却发现,公司主营业务几乎无法持续贡献盈利,尤其是在2019年,公司1.11亿元的归母净利润,几乎全部来自政府补贴。 2019年,同兴达实现归母净利润1.11亿元,而当期的政府补助高达1.39亿元,这直接导致上市公司扣非后归母净利润仅为205.08万元。 不仅是2019年一年,2017年、2018年,公司扣非后归母净利润逐年下降,分别为1.08亿元、5313.74万元,可当期,公司能够计入损益的政府补助分别为4955.84万元、5547.93万元。凭借着政府补助,同兴达2017年、2018年的归母净利润稍稍好看了一些,分别为1.49亿元、9808.64万元。 面对盈利能力连年下挫的主营业务,同兴达却做了一件令人匪夷所思的事情——把快速成长的摄像头模组业务,分38.87%股权给实际控制人及公司高管,而且作价很便宜。 2019年12月14日,同兴达发布公告称,公司全资子公司南昌光电拟进行增资,引入上市公司实控人之一钟小平、上市公司副总经理梁甫华作为增资股东,二人分别出资1.394亿元、8760万元,分别获得增资后南昌光电23.87%、15%的股权。相当于投后估值不到6亿元。 南昌光电主营摄像头模组的研发、生产及销售。彼时公告显示,该公司2019年1月至9月营收为4.15亿元、净利润为1591.31万元。或许是因为盈利表现不突出,南昌光电增资时采用的是资产基础法来评估,资产增值率仅为4.27%。 可几个月后发布的2019年年报显示,南昌光电2019年的业绩迅速增长,当期营收为8.8亿元,同比增长超过30倍;盈利为3422.41万元,同比增长超过580倍。对照2019年前三季度数据进一步分析,南昌光电在2019年第四季度实现营收约为4.65亿元,实现净利润1831.1万元,两个数据均超过前三季度总和。 需要注意的是,同兴达宣布为南昌光电引入资金方就在2019年12月14日,只要公司治理没有问题,同兴达、钟小平、梁甫华都能够明确知道,南昌光电的业务正在爆发,甚至已经掌握了第四季度前2个月的数据。可其在披露方案时,依然只公布了2019年前三季度的数据,并用资产基础法评估后低价“让出”38.87%的股权。 如此一来,一条向实控人等转让部分优质资产的脉络逐渐明晰,虽然该方案通过了彼时的股东大会,可南昌光电这样的子公司运营得如何,只有内部人才能知道,如果他们选择不披露更加翔实的信息,其他中小股东怎么可能做出合理判断? 从行政人员人数变化疑团,到事关公司盈利多寡的所得税率变化不及时披露,再到重要子公司对关联方增资扩股时作价公允性存疑,同兴达呈现给外界的面貌可谓矛盾多多。这背后究竟掩藏了什么不为人知的运作?
伟大的产品,不一定以「标准化」开始,但一定以「标准化」结束。如果没有足够标准化的产品、没有十倍领先于行业的商业价值,面对磨刀霍霍的金融机构,面对虎视眈眈的互联网企业,创业公司没有未来。什么样的AI产品,才能让「金融科技企业」活下来?为此,雷锋网《AI金融评论》策划了「AI能否解决金融刚需问题」系列选题,借同一个话题,对不同背景的受访者、产品和客群各异的企业们进行采访,期望在不同的商业和技术认知下捕捉观点碰撞的火花。在前两篇采访中,我们采访了冰鉴科技CEO顾凌云、慧安金科CEO黄铃。本系列的第三篇文章,由品钛执行副总裁李惠科讲述他眼中AI和金融之间的关系。以下为李惠科的所感所想:90年代,我第一次遇到AIAI已经85岁了。对于人类而言,85岁已是垂垂老矣;但对人工智能来说,还只是个含苞待放的孩子。90年代,我上大学,恰好赶上中国人工智能研究起步阶段。如今在AI领域,应用十分广泛的场景有:人脸识别、自动驾驶等。但我们那会儿,比较火的是模式识别,雷达信号检测、医疗信号检测。当时,有医疗机构希望把AI应用在核磁共振等「医疗信号检测」项目中,我作为人工智能相关专业的学生,也参与了那一次POC测试。事实证明,AI在上个世纪90年代,便展示出它十分惊人的效果。通过训练人工神经网络、识别图像底层结构,人工智能很完美地把缺少的视图补充完整,并将扫描速度提高了整整10倍。这次POC测试,让我第一次感受到AI的魅力,也见识到了AI强大的跨界能力。在之后的几十年里,我也不断体会AI在跨界过程中的成功与失败,逐渐形成了一个感悟:“做一个AI产品,一定要结合它具体的业务场景。”金融是一个数字化程度很高的行业,在财富管理、大数据风控等领域,因为能积累海量数据,使得AI的使用效果较好。当然,判断AI的实际应用效果是好是坏,通常还需要一系列的量化指标。在财富管理领域,就比较注重「投资回报率」、「最大回撤率」。此外,还须考虑它的稳定性和开放性。开放性,指的是AI和其他产品集成的能力;稳定性,意思是AI产品是否足够安全、可用、易于扩展。具体来讲,我们会评估这个产品的流程开发能力、API接口、可编程用户界面、控制系统、安全、审计、维护等综合技术能力。当然,并不是所有和人工智能相关的应用,都已经有量化的指标;也不是所有场景,人工智能都可以无限适用。糟糕的体验AI被过于神话了。严肃的讲,在试用一些合作伙伴演示的AI产品时,我的体验很糟糕。我们经常会遇到这样一个算法,在理论层面,它的准确率非常高,但是应用案例却很少。比如语音识别,的确,一些大厂的AI语音产品做的越来越好。但是如果你和这些AI日常对话,它仍会错误百出,甚至让你捧腹大笑。这样的例子不在少数,全球最大的消费级机器人制造商Anki破产;智能驾驶汽车撞人;智能语音助手大半夜突然放音乐等。目前已经成功的AI相关业务,一般是在特定领域可以抽象化、标准化的。而个性化、定制化程度高的AI业务,则需要理论化和工程化结合的更敏捷的解决办法。信贷风控就是一个很典型的例子。在信贷风控场景下,中小企业的日常运作常常不规范,没有统一的标准和形式。数据的来源不同且十分杂乱,必须要进行数据结构化处理以及数据清洗,才能让AI的应用达到比较好的效果。而且要不断积累数据,反复训练,逐步提高。而同样是信贷风控领域,电信场景下因为海量高质量数据的存在,AI的发挥也就更如鱼得水。找到合适的业务场景,永远应该排在第一位。选择技术,远远没有选择场景、解决痛点重要。企业家不空谈技术和算法,应该从业务出发,讨论技术的可行性,培养优秀的算法科学家,积累足够多的数据,反复实验验证,一定不能急于求成。从策略上讲,我们会快速迭代、不断试错、逐步完善产品。人工智能不用刻意神话,现实中我们遇到的大部分问题,其实一个简单的决策树就可以解决。一个简单的决策数和统计模型就完全可以处理低维度参数或符合特定规律的数据。然而,在今天的信贷风控中,我们往往要引入复杂的参数和动态的变量,尤其是现在互联网平台下,那些未被央行征信覆盖的客群,我们需要通过搜集客户在日常工作、生活中产生的海量行为数据,提炼客户画像。当数据集越来越庞大,我们一般会选择机器学习来处理,如果这时还用单一的决策树或统计模型是显然不合时宜的。数据想要变废为宝,需要多种方式“出力”;一个行业的发展,更是如此。赶上时代浪潮一个科技细分行业想要发展,离不开这个链条中所有上下游公司、以及监管部门的共同努力。比如5G行业里规则的制定,监管在具体定调之前的调研不仅有本国的公司,还有全球各国企业的共同参与。这些参与其中的公司,还分下游的运营商、上游的设备商、中间的测试厂商等。这些厂商和各国政府机构、国际组织一起制定行业规则,每一个服务商在其中都会发挥自己的作用。金融科技行业的发展也是如此,下游有TO C厂商、上游有数据提供商、中间还有平台解决方案提供商。每个层级的厂商都会提出自己在这个行业里的见解和看法,同时政府和监管部门也会提出自己的看法,大家一起推动行业的发展。政府和监管部门跟业界之间的讨论是非常频繁的,一些高级别的监管官员会直接在群里,提各种各样的问题和业内的公司管理者们一起进行思考。金融科技行业的未来发展不单单依赖于监管机构、企业的群策群力,更关键的是它契合了人们对未来金融产品的期待。新一代的年轻人在数字化变革当中长大,他们长大后对金融产品的需求不是传统银行业务可以满足的。AI通过算法向用户主动推荐产品、判断用户的兴趣,可以更好的了解客户、了解市场、保持和客户的连接。做一个产品或者给客户提供一个服务,不在于追求算法多么复杂、多么炫酷。我们以前设计的IT产品,大多是给技术人员用。而近10年以来,所有产品设计的导向是给用户使用。当企业做的产品客户不会用,不是客户不好,是产品没做好。随着互联网的蓬勃发展,这20年来数据呈现出的爆发式增长,使得人工智能在金融领域创新成为可能,我们赶上了好时候。而这只是刚刚开始,现在进入这个行业的年轻人创业者和优秀人才,仍有着广阔天地,大有作为。
近日,香港人工智能与机器人学会(HKSAIR)创会理事长、微众银行首席AI官、香港科技大学讲席教授杨强老师,领衔HKSAIR《AI金融》系列线上讲座第一课,主讲联邦学习及其四大应用场景。以下为杨强教授演讲全文,雷锋网做了不改变原意的整理:我们这次的课程系列,与当前大家在工业界和学术界非常重视的一个议题相关,就是如何利用数据做人工智能的模型,同时又能够保护用户的隐私,保护数据的安全。很多同学听说过深度学习,听说过监督学习,可能没有听说过联邦学习。这个也是要给大家交代一下联邦学习的由来。为什么我在微众银行建立AI团队?我在观察金融的各个方面能不能用AI的模型给包装起来。因此我们设计了以下四大版块,产品和业务已经出炉,可以说是“AI落地急先锋”。详细说一下AI+服务,比如开户验证身份要进行人脸/语音/指纹识别,又比如小微企业的企业主申请企业贷款上传执照要通过OCR图像识别、文字识别获取,自动产生信用评估。现在AI+服务大概每天能处理百万以上的这种需求。以语音识别为例,我们做到了自主自研,与众多业界领先的语音识别的提供者相比具有明显优势,一是因为我们金融领域的知识,有大量特定话术和专业词汇的储备,在各种具体的特殊环境下都能处理。二是我们有非常先进的联邦学习技术,这就是今天的主题。还有迁移学习,可以很快把通用模型适配到特殊的场景。AI+营销,有了产品也要有能力传播出去,找到对的人和企业,去提供金融服务。怎么找到正确的需求?比如微信朋友圈,大家有时候会看到小微企业贷款广告,说明系统“认出”你是一个小微企业主。我们通过很多的特征来识别,很快赋予额度给小微企业的企业主,秒级批准。另外,推荐系统是非常有用的一个技术,我们把推荐系统和迁移学习、联邦学习结合起来,形成了新的技术优势,后面会细说。在金融行业一个很大的优势,就是风控非常严格,要高效做信用评估,那就需要很多数据,360°来观察企业或者申请贷款的用户。但同时又不希望这些数据的隐私被暴露,如何能够做到这一点?这,就是联邦学习要做的事情。举例:金融保险定价,我们把违约概率大幅缩减,个性化的保险定价提升8倍。小微企业风控模型准确率提高,相应地,坏账率降低。我们有一个叫做揽月的产品,是从卫星视角往下看,能看到企业的经营状况,比方说左下角可以通过卡车个数和活跃度看到矿业的经营状况。右上角是农业种植区域,可以通过卫星评估产量。左上角是洪水泛滥受灾地区,通过卫星对地区受灾的程度进行定价。右下角是烟囱污染,环境在投资里是社会价值的体现,对环境的保护体现了公司治理水平,相应产生的ESG指数,很多也来自于于卫星图像观察。综上所述,这4个版块,2个是前端的(服务、营销),2个是后端的(风控、资管)。金融小数据与隐私保护的双重挑战在这个过程中,数据是非常缺乏的。要保护我们的隐私,同时也想要服务,怎么做到?下面这句话叫做“数据不动,模型动”,希望大家就记住这7个字。这个就是联邦学习的精髓。AlphaGo出现以后,人工智能井喷式发展。但我们周围日常的生活,有的却是小数据,不要以为大公司就一定有大数据。像在金融里面有很多的数据,其实是黑天鹅现象。比方说在反洗钱应用中用于模型训练的洗钱案例,其实数量并没有想象中那么多,还是属于少数现象。这种数据拿它来训练,效果不是很好。在医疗也是这样,每天都有那么多的病人,一定是大数据吗?有一家公司叫做第四范式,用人工智能赋能金融场景。有很多头部银行都在使用它的产品,其中一个案例很有意思:豪车这种大额贷款,如果要建一个模型来做这种大额贷款的信用度的评估,数据往往是在上百例以内,这点样本是没有办法训练一个好的深度模型的,或许可以来训练 support vector machine(支持向量机)或decision tree(决策树),但往往不精确。又比如,大家都很憧憬无人车的到来,但迟迟不来,其中一个重要的原因,就是因为无人车还不靠谱。我们不知道它见到一个它没见过的情况会发生什么,为了应付这种情况,可不可以把所有汽车上面的传感器、摄像头的数据全部聚合在一起,飞快地训练一个无人车的视觉模型?不行,因为每一个在路上的车辆,虽然它可以收集自己前面的影像数据,但是它不肯把这个数据和别人去共享,因为它有很多出行隐私在里面。即使这些无人车都是跟云端在连接的,模型却没有办法及时更新。很多类似的端计算场景,就没有办法真正的实现,因为数据的割裂和短缺。能不能把这些众多的小数据集给聚合起来,成为大数据?过去,确实是这样做的。现在,这样做的结果就是违规。比方说,欧洲在18年就推出了一个非常严格的个人隐私法规,说数据的拥有权是绝对在终端用户那里。如果服务器端的公司,要用户的数据来训练某个模型,比方说搜索引擎的模型,它就一定要得到用户的许可。假设明天它要用同样的数据去训练推荐引擎的模型,那又得到用户那去,得到新的许可。用户如果哪天说不希望你用我的数据在你的模型里了,那么从此以后,这个公司就没有办法用用户的新的数据,这个叫“被遗忘权”。很多巨头因此被罚,Google就被罚了5000多万欧元, Facebook也遭受了滑铁卢。在国内,数据的隐私保护已经是处于一个非常严格的态势,很多大数据公司,在过去都是新贵,但是现在都变成了阶下囚。我们现在在国内的银行里面工作,深知数据是红线,万万碰不得的。应该说,联邦学习现在已经变成了国内外的技术上的一个重大趋势,并且它已经是一个跨领域的概念,它不仅仅是技术,而且是商业,它有自己的商业模式。何为联邦学习?在过去,数据动模型不动,也就是说我们从各地来购买数据,或移动数据到一个中心点,在中心点建立模型。用一个简单的例子来给大家进行解释:假设用一只羊来类比机器学习模型,草就是数据,我们希望羊吃了草以后能够长大。过去的做法是,把草买到一起来建立模型。比方说左边的模型,左边的箭头是指向羊的。羊不动,但是草被购买到中心。相当于用简单粗暴的办法来获取数据,形成大数据,来建立模型。但我们希望能够保护各自的隐私,所以让草不动,让羊动。这样羊既能吃那个地方的草,主人又不知道到底吃了哪些草,久而久之羊就长大了——这个就是联邦学习的新思路,就是让草不出草场,本地主人无法知道羊吃了哪些草,但是羊还是长大了。比如每一个手机都是我们个人在使用,形成了一堆样本。有不同的手机,每个手机基本上取的这些特征都一样,但样本却不同。我们希望在数据不动的情况下,能够聚合这些手机上的数据的这些能力,建立大数据模型。左边所示的数据集们,依次对应右边各终端上面的数据。它们的特征是纵向的,X1、X2、X3是类似的,但样本U1、U2…U10却是不同的。所以这个叫横向切割,按样本切割,简称“横向联邦学习”。我们可以在本地建一个粗糙的模型,用w来表达它的参数,同时对参数加密。有密钥的人才可以看到内涵,别人和服务器也看不到加密后数据包里的内容。服务器得了加密后的参数,就可以通过某种形式,把这些加密后的参数加以更新、聚合、处理,形成一个更大的模型。这里大家可能会有疑问,你得到的是一个加密的包,是一堆乱码,怎么可以把两堆乱码加到一起?还成为一个有意义的模型?这个问题,我留在下一页来解决。每一个地方的数据,就对应这里有一个颜色的小表格,行是每一个用户的数据,列是每一维的特征。可以看到这个特征在不同终端上的特征是类似的,但是用户不一样。按照用户来切割,并没有按照特征来切割。有了这样的一个形态以后,我们就可以把刚才给大家讲的故事,写成一个算法。这个算法里最关键的第4步是把运到服务器端的加密模型,这些包用一个f函数来处理,它是一个机器学习算法,作用在参数上。我们原来有这么一种新型的加密算法,他可以让机器学习的算法可以穿透加密层进到内涵,也就是说我们对一堆加密包的某种数学运算,相当于对于某种数学运算的加密。这其实是一个小学的概念,叫做distribution law(分配律)。同态加密,可以把多项式的加密,分解成每项加密的多项式,A+B的加密,变成A的加密加B的加密,这是非常伟大的贡献。因为这样就使得我们可以拿一个算法,在外面把算法给全部加密,加密的一层可以渗透到里面的每个单元。安卓系统利用刚才所说的横向切割,即横向联邦学习的方法,不断更新一个总的模型,并且把总的模型分配到本地。在这个过程当中没有数据移出本地,并且即使在云端在进行运算的过程当中,也不会偷窥到任何的这个参数和任何的数据本身。所以,谷歌的安卓系统现在已经在使用,通过基博尔系统对输入法进行更新。如果是某互联网公司和某家银行合作,并不按照样本切分,这两家可能具有同样的样本,用户群类似,但却有不同的特征。这种情况下,数据其实是按照特征纵向来切割的,所以我们管这个模式叫做纵向联邦学习。比方说两家数据拥有方各自建立一部分的模型,但是在建立的过程当中,它需要知道那一部分模型所计算的结果和梯度,计算的梯度来告诉最后的结果是在往哪个方向发展,这需要一个gradient和一个era。在交换过程中,又引入刚才所说的同态加密的算法,使得两边可以在不看对方数据内容的情况下,不断更新自己这一部分的模型。这是训练的过程,我们还有使用的过程。使用的过程叫inference,也需要两方来进行。也就是说,如果有一方到一半的时候说不合作了,那么联邦模型就应该停止,这个效果也是可以实现的。我们现在讲了两种模式,一种是横向联邦,那么横向联邦更多的是to c。to b 是几家公司有意愿合作,可能数目不多,但每一个地方的数据都是客观的。在这种情况下,他们要做出1+1>2的效果,就可以用纵向联邦来进行。问:联邦学习和分布式机器学习最能区分的点是什么?可能以前做机器学习的同学做过分布式机器学习,比方说有参数服务器这样的概念。分布式机器学习,目的是加速,加速的办法是通过网络、多个服务器的平行并行计算。它就要考虑把这个数据给切分成不同的块,使得每一块的计算是在不同的服务器上进行的,但是每一块它的分布又是差不多的。但在联邦学习中,我们不能保证所有的数据拥有方,它的数据分布是一样的。分布式机器学习的目标是加速,联邦学习的目的是合作,同时保护隐私,所以最终目的还是不一样。问:联邦学习和安全计算是什么关系?国外是不是有类似的这种经验?安全计算应该说是联邦学习的重要组成部分,联邦学习不是一个孤立的算法,它是一个综合性的学科,安全计算是为它提供工具的。前面说到安全是用同态加密来进行,也可以用其它的方法,比方说姚期智院士发明的Garbled Circuit(混淆电路)。问:区块链听起来和联邦学习有点像,都是在多方进行的,它们是不是有些异同?它的做法可能有些相同,但是也有巨大的不同。相同的地方是它可以用区块链的分布式记账功能来进行有效的激励措施。激励措施是我刚才所没有讲的,就是说怎么鼓励参与方持续地投入,参与到联邦里面来。同时去中心化的概念,也是我们尤其是纵向联邦里面的一个概念。但一个很大的不同是,区块链为了保证 transparency,还有保证数据的不可篡改性,那么它要把同样一份数据多次copy到不同的场景,最后大家要有一个vote的机制,但是联邦学习却不然,联邦学习是一个数据,只有一个copy,它不能够出本地,所以它的目的就是通过这种uniqueness的方法来保证用户的数据的隐私和安全。还有我们新提出来的虎符性概念,就是多方参与,才能够计算。缺了一方,这个就无效,就像战国时代,你要把虎符两个印要对上才能够用兵,这个是联邦学习的一个优点。问:如果有一方数据是坏人怎么办?比如横向联邦,如果有一个手机,它其实是坏人,它参与了计算,那么它每次贡献的模型都是在下毒,也就是说它在把最后的结果在朝着他对它自己有利的方向发展,或者在纵向联邦的时候,两方当中,其中有一方,它的目的就是为了窥探对方的隐私, 怎么办?在场景下,我们有各种各样的做法。比方说做OCR,written text是0,这个是原始数据,我们让计算机识别0。如果不做加密,我们没有一个机制,这种所谓的对抗是可以做到的,坏人是可以通过参数或者一系列梯度的泄露可以反猜原始数据。在建立模型训练的过程当中,如果这个模型的 gradient不断被引向到一个第三方,第三方获取 gradient,最后reconstruct我们就用data,通过这样的办法可以去做窃听。题目也是在去年NIPS得到最佳paper的一个题目,是MIT韩松教授做的。应付它的方法,也是联邦学习的一个拿手好戏。比方说假设一个player,半诚实(Honest-but-curious)就是好奇,但本身不坏。还有人是恶意的,想搞破坏,想得到用户隐私,然后获利。对于不同的假设,可以设计不同的联邦学习算法和多方计算算法来防止下毒,还可以做零知识(Zero knowledge)和一些知识(Some knowledge)分类。服务器端也可以区分是不是恶意中心、恶意的数据节点和非恶意的数据节点。问:金融场景有没有遇到过坏人?在联邦学习里面,如果有同学现在在找题目,说我能不能在联邦学习找一个硕士题目或者找一个PHD的topic?完全有的,但是要聚焦,因为联邦学习涉及的方面实在是太多了,所以如果你要找一个题目,你往往会找一个子题目,比方说如何能够做到安全合规,如何能够设计一种机制防御攻击,提高算法效率。比方说我们科大的陈凯老师,他带领的团队就在设计全世界领先的算法,网络效率可以通过网络的设计,包括网络protocol、芯片的设计来提高。还有王威老师、宋阳秋老师,都在设计算法,他们的算法都是非常精确的。问:你讲模型我还是云里雾里的,模型到底是做什么的?打个比方,现在每个人都用手机,有时候也看抖音,一看就很长时间过去了。为什么抖音能做到这一点?精准的推荐和个性化,利用数据来做推荐系统。如图所示,比方说我们有很多的手机,每个手机上都有数据。抖音的做法,是把每个手机上的数据上传到云端,再利用所聚集的大数据训练模型,再适配到每一个人的个人数据上,就变成个性化推荐模型,再给推到手机端,就是循环往复这样一个过程。这过程有个缺点,就是它侵犯了用户隐私,每个人的数据,云端就会看到。怎么防止?这里我就要说联邦学习+推荐系统,就是联邦推荐,这个也是我们第一次提出federated recommendation的一个算法。它的算法宗旨,就是对每一个手机上的 transaction,用户以前看过的视频或者书,进行矩阵分解,得到用户空间和产品空间。如果你们喜欢数学,你们可能知道本征值、本征向量,线性代数里面的概念,实际上就是求这个值,但基于本地数据求值是非常不准的。所以通过联邦学习,能够让他们既能够利用所有的数据来求 ,同时不把本地的数据暴露给其他任何人。这就是联邦推荐的概念,可以在toB的形势下实现,就是纵向联邦。纵向联邦现在应用在哪里呢?又有一个新的名词,叫做联邦广告。现在互联网的一大经济支柱就是广告,在现有的广告架构下,广告是不可避免地侵犯用户隐私。联邦广告可以让广告方、投放的媒体方、用户方各自保留自己的数据,同时提高投放准确率。问:联邦学习训练后的模型是一个公共的模型,而各个客户端的数据经常是non-iid的,怎么办?联邦学习训练后的模型,是一个公共的模型,而各个客户端的数据经常是分布都不一样,比方说我们有一个手机是女生用的,她看的短视频和一个男生用的手机的看的短视频,可能是完全不一样的短视频,因此我们拿他们两个的数据粗暴地做数据联邦,这个效果是肯定不好的,这是机器学习的一个常识。怎么办?我们还有元学习,和多任务学习、迁移学习是可以解决non-iid问题的。又要给大家提一个新名词,叫做联邦迁移学习,在之前每一端都先要做一个联邦迁移学习,找到自己的一个子空间,在这个数据子空间的比对下,大家可以认识到自己找到的子空间,各自找到子空间是属于同分布的就可以。那么找到子空间,可以用联邦学习来实现。这个领域论文非常的少,所以如果有同学在找题目,我鼓励大家在这个方面发力,一定是明年各个顶会的文章,best paper一定是属于你们的。联邦学习应用案例小微企业信贷风控假设我们要给一些小微企业贷款,又不知道小微企业的情况,第一个可以问询的是央行征信,比方说他过去在某个银行贷过款,信用度如何,但这种数据,它的样本往往是非常少的,所以只是去找央行的数据远远不够。我们希望用到的数据是多方面的,比如工商、税务、舆情,还有各种资产的数据。但是这些数据拥有方,往往都是政府的不同部门、不同的企业。有专门的公司去帮助这些小微企业建立电子化的发票,有从专门的业务角度观察,我们只有用联邦学习才能说服他们来参与,否则他们担心核心资产会被泄露。这里的例子,是我们在企业贷款里面基于联邦学习的风险控制模型。某个银行和某个发票企业最后形成联邦,大为提升准确率,降低坏账率。保险联邦建模保险其实就是风险,风险和数据是分不开的,数据越多,风险越低,因此保险公司在某些程度上也想合作,因为不同的保险公司有不同的数据。有的保险公司是专门为保险公司保险的,叫做再保险公司,比方说瑞士再保险公司,是世界上最大的再保险公司,有100多年的历史,这些公司在过去因为数据割裂,没有办法合作的。现在就在用联邦学习,而且取得了非常好的效果。计算机视觉比方说我们有不同的摄像头,每个摄像头都覆盖一个区域,这个地方的数据是公司的核心资产,不愿意和别的公司去share,但是他又希望利用到别的公司的数据,来增高自己的准确度,这个时候就可以用到联邦学习,我们叫视觉联邦,已经落地实施。每天深圳的建筑工地用来探测危险,影响施工的一些现象,比方说明火抽烟和不戴安全帽的现象。另外,语音识别、IOT在仓储管理的场景,联邦学习也有所应用。不同的仓库可以形成线性联邦,监测地方仓储状况,这些状况就为风控模型和为物流业的决策提供了保障。医学应用我们最近和腾讯的天眼实验室合作,成功构建了一个“脑卒中发病风险预测模型”,通过使用来自就诊记录数量TOP5的医院真实就诊数据验证,联邦学习模型和集中训练模型表现几乎一致,在脑卒中预测模型中的准确率达到80%,仅比集中训练模型准确率降低1%。同时,联邦学习技术显著提升了不同医院的独立模型效果,特别是,对于两家脑卒中确诊病例数量较少的医院而言,联邦学习分别提升其准确率10%和20%以上。联邦学习不仅仅是一个算法,而是一个操作系统。因为有激励机制在里面,可以把不同的行业给凝聚在一起,使得大家有动力,不断用联邦学习来做联盟。除了刚才提到的场景,还有银行和监管联合跨境反洗钱,互联网+保险,互联网+银行风控,互联网+零售,这些问题都可以通过联邦学习更好解决。我们建立生态,建立平台,建立标准。也希望这个不仅仅是一个算法,而是新的paradise。我有的时候跟媒体讲,AlphaGo代表了AI 1.0,它就是说在一个地方有数据,在一个地方有算法,在一个地方可以有一个很好的模型,就是AlphaGo。现在我们进入了AI 2.0,我们在不同的地方有数据、算法、业务,我们还可以做AI,这个是谷歌所没有做到的,中国现在在这个方向是领头的。怎么做到这一点?首先要建立标准。我们特别自豪的一点是,世界上第一个联邦学习的产业联盟,建立的IEEE的标准,已经到了最后一步,马上就要正式发布了,敬请关注。同时在国内,有联邦学习的团体标准,这个也是微众银行领衔发布。我们有一个联邦学习的开源平台,就在Linux Foundation上,是金牌的开源平台,短短两个月就收集到贡献者打的上千星,到现在已经2000以上。在短时间得到这样的认可,也是非常难得。
6月11日,京东数科与东方红资产管理与合作的第二支大数据基金“东方红智远三年持有期混合型证券投资基金”正式发行。京东数科旗下资管科技平台JT²为该基金的投研工作持续提供智能数据挖掘等技术支持,助力基金管理人对大消费行业形成深度研究。 据了解,目前,“东方红智远三年持有期混合型证券投资基金”已经在东方证券、招商银行、京东金融APP等渠道对外发售。 在投资策略方面,该基金将动态跟踪海内外主要经济体的GDP、CPI、利率等宏观经济指标,以及估值水平、盈利预期、流动性、投资者心态、消费价格指数等市场指标,对这些关键指标进行全面评估,以实现合理的大类资产配置。
万事齐备,只欠东风,但是“东风”真来了的时候,坐在船上的人又是左摇右晃,整体市场也是随风飘荡,这就是“借东风”的结果。从结果上来看,“东风”借与不借都是两可的事情。我们所说的东风指的是美国股市,美国股市上周五的时候暴涨,道琼斯指数涨幅3%,因为公布的非农就业数据是相当的好。从预期大概会减少800万非农就业人数,到最后增加了250万人的就业,里外里差距是非常非常大的。但是实际上消息披露之后,美国劳工部马上出来打脸,称非农数据“失真”。 因为就业分类标准不同,所以目前的统计数据可能会产生了差错,误差在3%左右。这样一来失业率就从13.3%变更为16.3%,比四月份14.7%的失业率还要高。虽然美国5月非农就业数据摆了个乌龙,但是我们回过头来看,道琼斯指数周五数据没出来之前,走势也是相对强硬的。纳斯达克指数甚至创出新高。这就说明美国股市一直处在一个强劲的反弹中。 即便美国5月非农就业数据摆了一些乌龙,水皮觉得也不会改变趋势的。特朗普也在开巴菲特的玩笑,因为巴菲特的航空股的确是在底部清空了,但是美国航空周四涨了40%,周五又涨了10%,两天下来涨了50%。巴菲特可能真的是要哭晕在厕所里了。 美国股市的走势反映出大家对疫情的一种心态,水皮觉得最恐慌的时刻的确是已经过去了。就业数据的变化多多少少反映的是美国复工复产的进程,即便数据有水分,或者统计不完整,大家还是给了一个好的预期,这是最重要的。当然美国、欧洲疫情如果能够尽快平稳,而且能够尽快控制,对于全球整体经济复苏都是有帮助的。所以水皮说的东风也是来自外部。上周,我们在股评节目里面就说要“等风来”,周五的时候股评是“清风徐来”,但是风真来的时候,因为风速过猛,反而倒是前摇后晃。 今天沪深股市高开之后,资金没撑得住高开高走,前期炒作的题材股反而逢高减磅,借机变现前期获利。多多少少跟美国的六大科技股的走势有点像,因为六大科技股前期在疫情扩散时期不断地创新高。当现在金融股、能源股、航空股反弹补涨的时候,这些科技股反而走软。这一点跟A股情景其实是非常相似的,因为大家炒股的目的还是为了挣钱,目前有利的情况下水皮觉得有变现的要求是正常的。前期被炒高的题材股今天回落还是比较明显的。 我们从开盘之前,收盘之后涨跌的个股的比例以及涨、跌停的个股的比例可以看出一个非常明显的变化。刚开市时的确兴高采烈的,最后收盘的时候有一部分投资人变现了。今天走势强一点的就是白马股,包括家电股、保险股;走势弱一点的是前期出货量比较大,被炒作的计算机板块。还有券商板块今天也走弱,券商也是前期被炒作的金融股之一,在现在这种比较相对箱体整理,存量资金博弈的行情下,券商的想象空间一时半会儿还是没法打开。但凡有脉冲式的炒作,有回落也是非常正常的。 今天成交量是6842.8亿元,这样的成交量不足以让大盘快速拉升或者走出快速上升的行情。应该还是进二退一或者左右摇摆的行情,资金还是在板块之间轮动,整体上应该是小幅的上蹭,一步一步抬高持股成本的过程。所以我们说东风借或者不借都是一回事。 一句话点评:清风不识字何故乱翻书。
近期,美云智数正式对外发布全价值链SaaS战略,首批推出SaaS产品阵容包括互联网大数据、采购云、工业仿真三大领域。其中采购云为中小企业供应链安全护航,对此企业网D1Net记者进行深入了解。 以下是系列报道: 全球贸易因疫情按下“暂停键”,联合国日前报告称,2020年全球经济预计萎缩3.2%;世贸组织预测今年全球商品贸易将下降13%~32%;国际货币基金组织提出警示,2020年会出现上世纪30年代大萧条以来最糟糕的经济后果。 倾巢之下,岂能独善?尽管中国已建成了门类齐全、独立完整的制造业体系,拥有全球最丰富的制造产业链条,但一旦贸易停摆,不可避免导致进口原材料、零配件存在困难,全球供应链中断风险不断上升。据IDC的3月中旬报告显示:截至今年第一季度末,中国现有库存消耗殆尽。 前事不忘,后事之师!疫情这面“镜子”照出我国制造业供应链管理的短板:原材料及零部件短缺、劳动力及物流中断或效率降低、订单取消导致成品缺货或积压、因无法如期履行合同造成的违约……与世界制造业强国相比,我国很多中小企业供应链体系建设仍处于初级阶段。 供应链“反脆弱”之战 供应链好比企业“任督二脉”,拉通企业订单、采购、计划排程、销售等业务流程,企业要保障正常生产离不开上下游协同配合,一旦产业链条上关键节点的供应出现问题,就会导致终端交付无法完成,影响所有关联企业的效益。 然而,面对疫情“黑天鹅”,也有一批制造业“集大成者”顶住了压力“反脆弱”。今年上半年,工信部组织开展“产业链固链行动”:以龙头企业带动上下游配套中小企业,增强产业链协同复工复产。其中有着52年制造基因的美的集团(000333)给人影响深刻:有媒体报道数据显示,3月份美的集团整体员工复工率实现87%,复产率达到84%,供应商整体复工率98%。 紧接着4月,美的发布了“智慧供应链”云平台――美云智数供应链云平台,帮助中小企业通过数字化方式打通上下游供应链,通过自动化订单、大数据风险预测和控制、智能化寻源以及协同溯源等各环节的精细化、数字化的管理,帮助企业降低供应链风险,促进中小企业快速复工复产。 在美的集团从业近10年的资深供应链专家――美云智数协作云产品经理马艳波与企业网D1Net记者交流时表示,我国很多中小企业处于供应链的中、后端,面对疫情这类突发事件时,供应链显得尤为脆弱。如何“反脆弱”?从美的经验中,我们再探一二。 数字化“云采购”价值 美的供应链究竟是怎样的?说起来,更像打造一种供应生态。美的集团供应链体系至今已经有51年历史,下个十年直奔“一甲子”,累积了丰富经验,由分散的采购科室,现已形成全球性的供应链体系,数字化在高效运营、拉通供方品质、产能实时在线等方面发挥了巨大作用,实现了从客户端到供应端整个大供应链的在线协作。 美的向供应商提供计划管理、物流管理、品质管理、采购管理等云端生产制造平台,当前已有4000家规模的供应商参与到这样的数字商业合作中。供应商通过平台数据即可获得美的订单、技术图纸、质量要求、计划排产信息、备货需求、送货指令、绩效评定、自动对账、金融贷款等服务信息,从接单到生产配送交货,全部数据驱动。 美的通过多年的供应链业务变革和信息化投入,逐步强化供应商协同,已形成采购生态链。基于最佳实践,立足工业场景,美的旗下新型软件企业――美云智数重磅推出采购供应链云平台,以“软件+知识+硬件”三位一体的云化策略,搭建SaaS+PaaS+IaaS云产品架构,引领企业数字采购新体验。 这一平台所形成的供应链精益管理方法论,全面数字化革新企业采购流程,对重点环节进行自动化、精细化管控,帮助中小企业提高采购效率,优化成本空间。 管理“四板斧”降本增效 自动化订单、智能寻源、采购风控、实时的数字协同四大环节,是采购数字化管理的核心内容。 自动下单:效率倍增 当前消费市场需求呈现个性化、多元化态势,企业面临多样化、小批量、多批次等诸多挑战,一旦订单零散,流程复杂,中小企业传统的手工方式难堪此任。故而在供应链管理中,根据供需进行自动化订单下达,显得极为紧迫。 供应链云平台通过订单系统自动分配符合条件的供应商,将采购配额、可供物料的状态与历史订单进行关联,通过数学模型与算法给出合理的建议,采购员一键下单,原来需要30-40人,现在仅10多人就能快速完成。 智能寻源:恰似“月老”撮合找最优供应商 在产品研发早期或量产后的辅配二供阶段进行供应商招标时,通过传统的评审专家打分评选,短则一个月,长则三、四个月,时间和人力耗损过大。这对中小企业而言,难免伤不起,信息技术解放劳动力,美云智数供应链云平台通过项目式招标管理分离招标的各阶段,然后根据业务要求配置节点进行招标,并严控流程、符合审计合规性。 此外平台还能像“月老”一样自动牵线搭桥,根据历史成交及相关的合同参数撮合企业找到最合适的供应商。同时内置的核价模型,还可以针对不同品类、物料工艺、材质给出相应的核价模型,实现物料价格的精细化管理。 采购风控:数据管理之“透视眼” 企业资质数据 、价格数据、历史订单数据、绩效数据,生产环节数据以及日常交付数据……这些数据孤立来看价值有限,但经过建立的数据模型进行分析,就能指导企业改善核心业务,并能实时监控订单的生产状况,避免供应商告知交不了货时,企业才“临时抱佛脚”想解决之法。 美云智数在供应链云上连接企业内外部数据,这对中小企业而言,等于助其建立一个数据中台,可视化展示生产、入库、发货、接收、检验等相关数据,让企业决策者和各环节责任人实时了解供应链安全状况,提高抗风险能力。 品质管控及溯源管理:”品检官”+企业授信“担保人” 就一般制造企业而言,70%的成本源于物料采购成本,也就是说,70%的品质受供应商产品品质的影响。如此关口,岂容有失?美云供应链云平台为此设立“品检官”。 马艳波表示:“供应链云平台里有一个专门的品质模块,主要解决企业产品品质管理不规范,品质数据失真,检验报告提供不出,或提供不及时,以及供方产品品质数据与客户对接产生断点等问题。”平台实时在线覆盖全部零部件,汇总从工艺过程、老化试验到OEM代工生产模式的品质管理等各环节的检验标准以及判断规则的数据,并最终形成检验报告,以便追溯产品品质。 此外,这个模块兼具“自学”能力,通过系统预制的模版借鉴客户或行业的经验,帮助中小企业了解物料应该检验哪些指标,同时为今后零部件的供需提供相互信任的证据。 据悉,除了应用于制造领域,未来美的供应链平台还采用区块链技术,为金融业提供企业品质信息等服务,作为信誉“担保人”为企业授信提供依据,实现供应链价值创新。 毫无疑问,随着信息技术的迭代发展,产业升级必将影响供应链的结构性调整,更快地洞察市场需求变化,更直接、高效地推进上下游供应链协同,才能主导成本优势,获得更多的弹性发展空间。新局势之下,企业供应链如何“危”中见“机”?值得深思。
>>习近平在宁夏考察 习近平强调,要全面落实党中央决策部署,决胜全面建成小康社会,决战脱贫攻坚,继续建设经济繁荣、民族团结、环境优美、人民富裕的美丽新宁夏。 >>5月社融增量超3万亿元 支持实体经济力度增强 5月份金融数据依旧保持着强劲势头,对实体经济恢复发展形成有力支撑。央行10日公布的数据显示,5月份人民币贷款增加1.48万亿元,同比多增近3000亿元;社会融资规模增量为3.19万亿元,比上年同期多1.48万亿元。 >>证监会党委即将启动十九大后第五轮巡视 证监会官方网站昨日发布消息,6月3日至4日,证监会党委召开十九大后第五轮巡视工作动员部署暨培训会,证监会党委书记、主席、会党委巡视工作领导小组组长易会满出席会议并做动员讲话。 >>上月CPI重回“2”时代 低通胀为货币政策提供调控空间 国家统计局昨日发布数据显示,5月份,CPI同比上涨2.4%,涨幅较上月回落0.9个百分点。这一数据不仅低于市场预期,也创下2019年3月份以来最低。分析人士普遍认为,未来猪肉价格将继续下降,加之高基数因素,下半年CPI或加速下行。低物价为货币政策提供了调控空间,预计下半年降准降息的可能性仍存。 >>中小险企“防火墙”有点弱 监管喊话有漏洞抓紧补 自去年银保监会启动网络安全专项治理工作以来,持续组织开展了一系列风险排查和整治工作,银行保险机构网络安全管理能力进一步提升。据上证报