6月30日,易居企业集团执行总裁 克而瑞CEO张燕在“2020易居数据资产大会”作了“不动产数据资产进化论”的主题演讲。张燕提到,克而瑞的产品应用,已经从以住宅为核心,扩容至整个不动产领域的核心节点;同时,克而瑞通过建立的数据中台和业务中台,实现了数据治理、算法构建和算力的升级。完成了不动产数据资产化的价值闭环;在未来,克而瑞将开放数据资源库、数据中台技术能力、数据应用场景合作和数据资产交易平台,共同打造开放共建的数字生态圈。
全文如下:
克而瑞的进化
各位克而瑞的新老朋友,大家好。2020年已经过去一半了,在过去的这半年时间中,大家可能已经习惯了线上见的方式,这可能是疫情带给我们的某种变化,等到疫情过去后,或许我们已经接受并且熟悉了这样一个变化。同样,类似的变化也发生在行业,发生在企业当中。
熟悉克而瑞的朋友会知道,我们是一家深耕在不动产行业,进行大数据应用和服务的公司。当克而瑞熟悉的数据变成了数据资产,那么克而瑞本身会发生哪些变化呢?这是我们今天想跟大家一起来探讨的话题,而我们把这样的一种变化称之为进化。
什么是数据资产
首先,我们来看一下什么是数据资产。数据的初始阶段是杂乱、无序且单位价值低下的。但数据可以通过清洗、梳理这样的数据治理过程,之后再通过构建出算法、模型,最终输出成数据的产品应用。当最终形成了数据资产,那么它便是相对可靠、稳定、有价值并且能够变现的。我们把这样的过程称之为不动产的数据资产化过程,而过去的15年中,克而瑞正是在一一践行这样的过程。
克而瑞如何实现数据资产的进化
那么克而瑞如何来实现数据资产的进化这也是我们今天探讨的核心主题,克而瑞的变化到底在哪里?我们可以从资源、算力、应用和模式这四个方面来一起探讨。
资源
扩容1:以新房数据库为主,扩容至全不动产领域数据库并举
多元异构的数据库是整个大数据应用的基础,它的发展方向首先是扩容,其次是颗粒度的深化。
扩容,克而瑞最初是以一手住宅为核心的方向去建立整体基础数据库,以新房为主。而从过去的两三年开始,克而瑞完成了整个不动产全域的数据库建设,包括商业、办公、产业、物业管理以及城市租赁等非住宅领域,今年更是启动了在地产金融和证券行业的应用,也包括新技术应用到不动产行业中形成了地产科技,上述几大核心领域中我们都进行了结构化和非结构化的数据库建设。
扩容2:以结构化数据为主,扩容至与非结构化图文数据并举
其次,整个大数据应用中,非结构化数据应用占八成以上,但地产行业的结构化数据在过去的应用中占到了主力,占比将近80%,比例正好颠倒。
过去两年中,如何从原来我们应用的报告,新闻资讯、从一些图表图文中去将非结构化的数据实现结构化,这是克而瑞在做的从数据库的源头去做的一个扩容。我们希望未来能够做到更多的非结构化数据的清洗、储存以及利用。
深化颗粒度:数据从中宏观下沉到微观、从静态为主到动静并举
颗粒度深化是另外一个范畴。POI数据是非常庞杂的,我们可以从各种源头获取,但难的是形成适合于不动产领域的相对完整的标签体系,并且能够做到全国覆盖。克而瑞已经完成了深耕不动产行业的完整POI数据库的建立。
其次,在区域经济和板块研究中,我们经常会用到栅格数据,将土地、项目以及配套等相关数据,下沉到1×1公里的栅格当中。在不断的数据产品应用过程中,克而瑞已对全国所有城市实现了栅格信息全覆盖。
如果说栅格和POI还是对于行业数据和静态数据的进一步颗粒度深化,那么客户数据则是我们这一两年中着力去深耕的动态数据。到目前为止,克而瑞已经建立了全国54个城市未来3-5个月内将释放的新房购买需求客群的客户画像,包括客户线下动态的群体画像及指标,这其中也包含到了租赁客户。同时,我们也在构建基于商圈和商务圈外围的整体客群数据和客户画像。
算力
治理升级一:进化数据治理标准
有了数据,第二步当然是更好地去使用这些数据,因此在过去两年时间里,克而瑞完成了自身中台的建立,包含数据中台和业务中台。其中数据中台有两个核心方向:数据治理和算法构建、算力的提升。
首先我们做的是打通底层大数据,建立统一的采集平台。根据业务场景和应用形成相对统一的数据应用标准,建立起数据之间的勾稽关系,形成统一的数据平台。同时虽然应用场景和产品有所不同,但在打造产品的过程中会产生相对需求比较集中的产品组件、模块组件以及数据服务组件,它们可以自由插入到很多的产品及应用中去,极大提升整个产品研发的生产效率。
治理升级二:进化数据治理技术
数据治理环节中,我们会应用到一些核心技术。数据识别其实主要是从报告、图表以及文本中提取结构化数据。这类工作过去都靠人工完成,而今天通过机器学习已经可以达到。其次,数据清洗的核心在于规则的建立,通过样本的机器学习,不断地深化机器学习的过程,最终达到数据清洗的目的。
整个数据治理过程中的核心是数据标准的建立,尤其是不同源数据之间用同一标准来进行数据勾稽关系的建立。在整个过程当中,我们还形成了数据的预警机制,希望在数据治理过程中就能够发现数据可能会出现的问题,而不必等到应用端的产品出来之后才发现这些问题。
算力升级一:结构性数据算力和算法升级
通过完整的数据治理之后,我们另外的一个核心工作便是通过算力的提升,来有效、快速地实现算法的构建。比如公允定价,在刚刚提到的栅格系统应用中,我们基本可以做到只要点击任意一个栅格基本单位,那么这个单位所对应的区域价值(即俗称的地价)就可以直接显现,而且是秒级回应。再比如大家熟悉的,我们在做前测时候都会去做的产品配比,过去更多的是靠人工、靠自己的经验来做方案的优化。而今天我们通过机器学习,可以通过设计出容积率、货值、利润最大化等核心条件,来筛选出来最优方案。每进行1%的调参,机器会进行800万次计算,最终把TOP10的最优方案推到前台,而这样的过程在2秒以内就能完成。再比如我们在寻找价值洼地的时候会经常使用的“人口密度”这个参数,它是没有标准数据的,我们通过自己构建的楼盘字典,再加上人口统计数据,通过算法建立之后,来算出每个板块,甚至于比板块更小的单位的人口密度,来支撑一些后端应用。另外,算法构建也不断的应用到了诸如市场预警以及城市周期等克而瑞的各类型线上产品中。同时,所有的算法,我们都能够实现数据的回测。
算力升级二:非结构化数据AI技术升级
刚刚提到的这些通过算力能够快速形成的算法,主要是集中使用在结构化数据中,而非结构化数据也是我们这一两年当中着重去深化和学习的。我们刚才已经探讨过,克而瑞在研究、服务输出的过程中会应用到大量的报告,包括上市公司的中报、年报;包括很多克而瑞自己撰写的报告;包括很多的新闻资讯、文章等等。而通过NLP的自然语义挖掘技术,进行深度的机器学习,最终我们已经形成了今天适用于不动产行业的非结构化数据的知识图谱,它可以应用的范围更广。在下半年克而瑞要发布的云图系列产品当中,它可以应用到舆情监测,也可以应用到智能营销等环节中去。
应用
系统产品扩容:从新房数据系统为主,扩容至全不动产领域数据系统
刚才我们已经提到了数据在最终应用场景中的输出。而大家熟悉的克而瑞提供线上产品和线下服务的传统模式,也发生了变化。原来克而瑞更多是以系统产品和报告提交给客户,而今天我们首先对内容和范围做了扩容,从以新房和住宅为核心,扩展到了不动产的整个领域,包含我们这两年一直在做的基于资管的资管云、投管云;包含我们在产业深耕过程中打造的文旅数据系统;包含我们今年成立物管事业部之后,完整地构建了起了第一个物管行业数据系统;也包含今天的城市租赁系统等。大家会发现,克而瑞已经从住宅跨越到了非住宅,从开发领域更多地踏进了运营领域。
应用载体升级:从解决方案为主,进化至智能BI系统并举
克而瑞除了提供数据产品,同时也做很多行业研究、企业研究,提供咨询报告给我们的客户。但是在今天,我们可能将这样的服务方法和载体也进行递进和迭代。比如我们可以提取数据,生成多种业务看板,最终形成商业洞察,这就是智能BI的应用。今年下半年会发布的云图系列产品中的云图洞察,就是按照这样的方向及逻辑在实现。最终我们希望看到的是克而瑞整个商业模式的进化。
模式
打造数据资产交易平台
整个行业都已经熟悉了克而瑞提供线上系统和线下服务。在这个过程中我们也在思考,如果我们的客户并不需要一个完整的系统产品,而只需要一些碎片化的数据,或只需要报告中的某些部分。同时这些客户或许也不再是以开发企业为核心,可能会扩展到广告公司、上下游产业链中的供应商,甚至还有跨行业的使用者。如果克而瑞给他们提供数据服务的话,又会是怎样的一种方式?这也是我们今天构建数据资产交易平台的一个很大动因,我们推出了添玑数据商城,本着这样一个愿景,在最终产品输出端口来形成价值闭环。
生态圈全景图
讲到这里,我们再来看克而瑞的生态全景图,或许会更清晰明了。首先,应用大数据的相关技术,构建多元异构的不动产数据资源库。第二步,在数据大脑平台上,所构建的算法、提升的算力得以不断进化。最终我们构建起基于区块链技术的数据资产交易链,这样的过程形成了数据资产化的完整闭环。
而这个生态圈的打造,核心是为了开放和共建,克而瑞将开放整个生态体系。
在这个体系中,我们开放数据资源库,拥有数据的供应商可以通过数据交换的方式和克而瑞进行互补,来丰富和扩大各自的数据库。除此之外,我们也可以跟有一定技术实现能力的合作伙伴,开放数据库给他们,共同形成新的产品和应用。
其次,我们也会开放自己的中台技术,通过技术赋能,去促进行业内甚至跨行业的整个不动产大数据的应用和服务。
至于开放应用场景的合作,我们跟跨行业或者行业内上下游产业链中的很多伙伴都探讨过这个问题,大家希望我们能够共建数仓,基于这个数仓最终形成不同的场景应用。克而瑞贡献了比较多的线上的系统产品,但仅如此是远远不够的,我们希望有更多的伙伴加入进来,使得行业在数字化进程中诞生更多的产品及应用。
而最终,我们希望在实现价值闭环的过程中,形成资产交易的完整平台。今天这个平台刚刚起步,更多的是克而瑞把自己的数据资产贡献出来,而在未来,数据的使用者也可能成为数据的提供者。虽然这种身份的转化或许在今天还未被大家清晰地意识到,但随着这个交易平台慢慢被接受,参与到其中的人越来越多,它的成长及扩容,将带动整个不动产行业的资产交易成为现实。
共同打造开放共建的数字生态圈
我们回到今天的主题——构建行业主链、共建数字生态,在这个完整的生态圈中,克而瑞非常希望通过自身的递进、迭代,成为生态圈中最重要的一环。
谢谢大家。