7月8日,阿里云计算最重要的一款产品——ODPS正式开放商用。简单来说,ODPS(Open Data Processing Service)是一项Web服务,大家不用花大钱建数据中心,就能分析海量数据。按照阿里云测试,100PB的数据任务可在六个小时内跑完,这个数据量相当于1亿部高清电影。
如何让数据产生价值?阿里云公开信中说,先得拥有大规模处理能力,然后才是挖掘、算法和分析。
ODPS之前一直在阿里内部试用。第一个“小白鼠”是阿里小贷。阿里小贷每天处理30PB数据,包括店铺等级、收藏、评价等800亿个信息项,运算100多个数据模型。目前,阿里小贷每笔贷款成本0.3元,几乎是普通银行贷款成本的千分之一。
中国科学院院士鄂维南认为,信贷审批最终一定要借助大数据。“风控测算肯定要用大数据,如果规模大的话,人工逐个审批效率太低。”
阿里云方面表示,“ODPS任何人都可以来用,设定好一套参数,拧开水龙头流出来的就是‘果汁’,随着原始数据和算法的改变可以千变万化。”眼下,阿里巴巴各项数据业务都在用ODPS“榨果汁”。
阿里巴巴创始人马云曾在多个场合表示,数据挖掘是阿里巴巴未来的工作重点。如今看来,阿里数据的变现才刚刚开始。
线上小贷风控
阿里巴巴最初成立小贷公司可追溯到2010年,如今已经在阿里巴巴、淘宝(含天猫)和速卖通三个平台开展信用贷款。目前阿里贷款和淘宝贷款是纯信用贷款,不需要任何抵押或担保,授信完全是靠大数据自动审批。
阿里小微信贷利用其阿里巴巴、淘宝、支付宝等电子商务平台上客户积累的信用数据及行为数据,引入网络数据模型和在线资信调查模式,将客户在电子商务网络平台上的行为数据映射为企业和个人的信用评价。其中,小微企业大量数据的运算依赖于互联网云计算技术,判断买家和卖家之间是否有关联,是否炒作信用,风险的概率的大小、交易集中度等,从而把握贷款的安全性。
“阿里小贷风控数据100%来自淘内数据。” 阿里小微金服微贷事业部总经理娄建勋表示。
目前,阿里贷款和淘宝贷款其背后的出资者均为阿里小贷公司。阿里小贷公司共有三家,其中重庆两家,浙江一家,近年来大股东不断增加投资,根据最新数据,目前资本金总计18亿元。
阿里小贷业务于2012年底开始实现盈利,其中成本主要包括资金成本、运营成本、税务成本、风险成本等。
娄建勋表示,在阿里小贷的风控中,大数据是核。近年来,风控的升级就是不断在其中加入新的模型。目前有70多人专职做模型,在模型的基础上,发放贷款全部由机器自动审批。
据记者了解,目前阿里各种小微信贷产品的平均坏账率为1.3%。
目前,阿里风控使用的模型多达几百种,包括防欺诈、市场分析、信用体系、创新研究等多种用途。阿里相关人士向记者介绍了两个主要风控使用的探索类模型,即滴灌模型和水文模型。
滴灌是现在最先进的农业灌溉技术,可以把养分和水以最优的方式给到植物以获得最大的受益。“阿里微贷事业部希望通过该模型的输出,把资金分配给真正需要扶持的诚信卖家。”阿里相关人士介绍。
滴灌模型基于卖家成长概率模型和卖家生存概率模型,通过这两个模型的结果交叉对比,对每家店铺做出一个长期生存和短期发展综合的评价。“例如某家店铺最近促销力度很强,利润率很低,那在卖家成长模型的评价结果可能是,这家店铺短期成长速度可期但长期生存有忧。此外,成长模型还能指出这家店铺具体是在哪个经营维度太过激进需要调整,或是哪些运营方面应该持续改进。阿里金融会利用成长模型的输出结果,给出具体的扶持计划和资金支持。”阿里相关人士表示。
水文模型亦是阿里小贷从2012年开始使用的风控模型,通过预判店铺未来经营情况来对客户的资金需求进行判断。“举例来说,在每年7月到8月是很多店铺的销售低谷,传统的信贷投放会在此时收紧,但实际上客户这个时候会为了年底的旺季进行大规模的采购备货,融资需求比较大。水文模型通过预知这种趋势,那么就可以指导我们对店铺进行提前的信贷投放。”阿里相关人士表示。
通过大数据模型的不断完善,阿里小贷发展迅速。2012年初,淘宝和天猫信用贷款的准入客户量控制在三四十万户,2013年使用滴灌模型以后,准入客户开放到了300多万户。“有了模型作为支撑,客户可以不断向下,现在哪怕只开了两三个月,只有几颗心的店铺,也可以获得授信。”阿里相关人士表示。
阿里小贷的模式在金融界也引发了很大关注,各大传统银行也纷纷试图利用大数据实现业务转型。今年1月,中信银行联合银联商务共同推出“POS商户网络贷款”业务,依托银联大数据,自动批贷,为商户提供50万元以内的短期信用贷款。其背后大数据的来源是银联商户的POS机流水等记录。
面对银行的挑战,阿里相关人士表示“和阿里没法比”。“银行的数据虽庞大,但维度远没有阿里多,只包含消费的金额和地点,却没有商品的信息等。”
尽管阿里方面充满自信,银行业内人士则认为,在利用大数据做信用贷款方面,虽然银行的数据资源并无优势,但银行的资金具有绝对优势。阿里小贷靠自有资金放贷,和银行的资金体量相去甚远,其业务模式和贷款额度必然受到限制。
“未来系”应用
众所周知,Google将世界杯往届数据在BigQuery上跑了跑,成功预测了本届世界杯八强名单。一下子,Google火了,大数据也火了。
阿里的ODPS正是一款跟Google BigQuery类似的产品。“如果哪位有数据,也可以来算一算接下来的比赛。”阿里人士称。
每当记者问到阿里大数据未来的应用,受访的阿里人都能将基因检测到羽绒服制造嵌入大数据这个“效率加速器”。
鄂维南对记者表示,这个社会中有很多浪费:时间、金钱、效率。大数据本身并不能带来直接效益,但它可以消除浪费。阿里大数据的变现也正是沿着该思路。
2013年,阿里邀请华大基因在ODPS上测试了基因测序,耗时不到传统方式的十分之一。“一旦未来真有生物危机爆发,人类可以赢得宝贵的破译时间。”阿里云公开信表示。
2014年5月底,支付宝发布了“未来医院”计划,目前已经在广州妇女儿童医疗中心试运行。该项目希望将社保、病历、检查报告等数据都纳入健康档案,还将引入高德室内地图的导航功能。在药品监控方面,未来每盒药品上都有一张电子身份证,从生产、流通、储存、配送、销售到使用,全过程的数据都跑在ODPS上,一旦发现问题药品,监管部门可以立即采取措施。
阿里利用大数据打造的“未来系”产品还包括“未来公交”。该项目旨在让用户把手机变成一张通行全国35个城市的公交卡。支付宝钱包表示,从长期看,随着云计算和大数据等能力的接入,“未来公交”对积累的用户数据进行云分析后,公交部门可以提升线路设置的科学性,大幅提升运力,减少某些线路“挤死”,某些线路“空死”的情形。
支付宝钱包目前也在尝试和中石油、中石化合作,将商品和加油站绑定,可以在加油时提取商品,节省快递费用。这背后所蕴含的大数据应用是分析用户的加油习惯和日常生活需求。
2014年5月27日,中国气象局公共气象服务中心与阿里云达成战略合作,海量气象数据将通过阿里云计算平台,变成可实时分析应用的“活数据”。公共气象服务中心计划深度挖掘利用的数据包括:60多年来的历史气象数据;全国2万多个观测站、卫星、雷达监测的气象观测数据,包括降水、温度、风力风向、地面结冰、太阳辐射、酸雨、空气能见度等30余种要素;短期、中期、长期的精细化气象预报数据;通过国际交换获取的全球气象观测、预报数据。
阿里已经将中国气象局的数据嵌入阿里来往、旺旺、支付宝钱包、高德地图等产品,多渠道传播气象等灾害预警信息。据悉,阿里还将参考气象局数据,指导季节性服装生产等。
惠及参股企业
阿里近两年来“多点开花”的投资步伐广为人知。自2013年至今,阿里已经投资了包括高德地图、UC浏览器、恒大足球、新加坡邮政、优酷土豆、新浪微博、银泰集团、文化中国、恒生电子、华数传媒等众多不同领域的企业。
一旦被纳入阿里生态圈,这些企业也将或多或少受到阿里大数据思路的感染。这些企业不仅和阿里之间展开了数据互换,企业之间也在交叉合作。
据高德软件有限公司LBI产品负责人逄金龙介绍,目前高德和阿里数据平台部门、BI部门、广告部门、O2O部门展开了合作,探讨怎样把地理的内容进一步落地。同时,高德也在和银泰网等其他机构在谈怎么样能够让地理价值更好地发挥出来。阿里云公开信中举例道,结合中国气象局的预报数据,高德地图不久后就能告诉你:“前方道路已严重积水,您的车辆驶入可能会遭水淹,建议绕道行驶。”
阿里和快的打车的合作广为人知,去年快的打车和滴滴打车曾经一度掀起价格战,给司机和用户不惜血本现金返利。而在促销活动白热化的同时,利用活动作弊套利的现象也层出不穷。例如可以点击“叫车”,输入“我已上车”,之后不断输入,仅付0.1元,套取剩余返利。而阿里如今的防作弊手段和阿里小贷的风控手段类似,也是借助大数据和资金链的关系,用模型识别不正常的行为,从而动态防控。
阿里和UC发布“神马搜索”也是双方在大数据领域的合作。在对外发布的新闻稿中,UC称阿里基于电商、云计算、大数据方面的能力与UC在无线互联网方面的积累碰撞,将给整个行业带来无尽的想象力。
6月12日,阿里巴巴与中国邮政宣布战略合作,阿里巴巴董事局主席、菜鸟网络董事长马云表示,这次合作正是要通过互联网手段,以大数据为技术底层,重新定义邮政和物流的新模式。据中国邮政总经理李国华介绍,下一步,中国邮政广泛的网点布局将与阿里巴巴的电商大数据充分结合,未来可以通过双方平台的对接,为线上商品提供网点网络订购、自提、配送等服务,将网购下沉到三四线县市和农村市场。
在阿里和银泰的合作中,阿里希望把银泰的实体店电子化、进行会员账号的打通,双方还可以基于用户大数据进行消费行为分析,挖掘新的商业价值。银泰和阿里3月宣布已经建立了1000个商品的数据库,但银泰方面向财新记者解释,数据库还在非常初级的层面,还没能实现线上线下库存的打通。
这般例子一言难尽。阿里相关人士表示,阿里大数据的应用可以分为预测经营活动、产品创新(结合天气数据丰富保险产品,智能推荐旅游线路等)、精准营销、科学生产(尤其是农业领域)、高效物流、专业预测等。其中专业预测包括饮料销量指数、羽绒服销量预测、针织衫销量预测、空气净化器销量预测、洗车市场预测、太阳能发电预测、居民用电量预测、农产品生产情况预测、灾害预测、航班延误预测、工程工期预测等。
此外,阿里申请个人征信牌照一事也成为坊间周知的新闻。一旦阿里获得个人征信牌照,其积累的海量用户数据将被制作成征信产品,提供给成千上万的卖家。
阿里更大的理想是建一个数据共享平台。业内人士猜测,这个共享平台可能用于阿里上下游企业,以及阿里投资的子公司企业。更大胆的猜测,也许有一天阿里会把数据做成产品,供全社会购买使用。