阿里巴巴是“数据窃取者”吗?腾讯可以“监控”我的聊天记录吗?百度会记录我所有的搜索记录吗?最近,一系列关于数据的事件又重新把媒体和公众引向关于大数据的最初的是非问题:付费通与支付宝中止在水电燃气收费方面的合作,此前马云对恒生电子的收购再度引发外界对支付宝可能“掌控”了金融数据的质疑。
实际上,对大数据的宣传与布道,可以说是互联网公司最乐于见到的:显得公司有未来感、有科技感、有益于社会、有益于用户。但实际上,全球范围内对大数据的应用都处于初级阶段,大数据最有益的应用其实不在于事后分析,推进和改善业务,而在于做以前做不到的事情。而对于这些,即使是最有大数据处理能力的阿里巴巴都还刚刚开始摸到门。但是即便如此,外界对于数据安全的担忧就已经达到了相当程度:大公司会不会成为“数据窃取者”?或者说,它们会不会成为big brother,知道所有人的所有事,一旦“作恶”,后果不堪设想?
这个时候,不免要提到关于大数据的几个误解:
第一,大数据的积累靠“偷”?
付费通和支付宝“分手”之后,付费通暗示,是支付宝过量的用户数据查询导致其系统成本增加而最终导致分手。也就是说,付费通在指责支付宝“偷”数据。在这里我不想讨论这两家公司的恩怨,业内需要厘清的是,数据的积累,真的是靠“偷”?
如此理解的人,还是将大数据理解为“数量大”的数据,且越大越好。但是,大数据的精髓和要义,不在于大,而在于在线、可用和流动。要说“大”数据,欧洲对撞实验室做一次实验产生的数据,100个BAT分析不完。而以往存储在磁带、胶片,甚至是现实世界中产生的大多数数据,都不能对未来的事情有所助益——因为它们还没有在线。
互联网普及之后,产生的数据可谓多,而Google找到了人们对数据使用的路径,做成了搜索引擎,把数据做成了生意。所以说,大数据的本质不在于“大”,而在于在线、可用、流动。要抓住大数据的机遇就一定要在观念上打破“垄断”数据的想法,数据不能利用起来就是一堆只会占用存储空间的无用字节而已。一些传统企业由于缺乏足够的大数据技术和经验,面对大数据的浪潮可能习惯性采取“自我封闭”的做法,这无非只能让自己与时代更为脱节。而即使是阿里、腾讯、百度这样的大型互联网公司,看似掌握了海量的数据,但和整个社会的积累相比也只是九牛一毛而已,同样需要在数据上跟外部保持开放和分享,并思考一条让数据分享双方都能获益和实现数据增值的途径。
第二,到底怎么靠数据赚钱?
数据不是个新鲜的东西,电力公司有你所有电力消费的信息甚至你的家庭住址,移动运营商有你所有话费消费的信息,医院有你的健康信息,但怎么发掘这些数据更大的价值?大数据的真正价值当然不是用来预测世界杯,目前所有的大数据应用中,真正称得上商用化产业化的还是在网络贷款方面。
还记得银行对小微企业是怎么放贷的呢?情况是:根本不放贷。因为评估风险的成本过高:银行派个人实地考察下,查查水表电话,支出的人力物力成本就上千了;另一方面,阿里小贷一笔放贷的成本却不超过1块钱,那么,这种成本的节省,甚至导致模式的变化,怎么衡量“赚了多少钱”?很难衡量。
总的来看,实际上互联网公司目前用大数据“赚钱”有两种模式:一是,提供基础的大数据处理能力,面向业界,收租用费;二是通过数据共享和交换开拓新的商业模式,共同分润。
第一种模式,已经有很多案例。例如脸萌团队租用某云基础设施,每月只有73块钱IT费用的案例被广为传播。
第二种模式的则比第一种模式要复杂。例如腾讯,可以将交易数据、社交网络中的有效数据脱敏之后提取出来,与一些功能性网站实现“交换”。例如,与世纪佳缘、51Job、赶集网、大众点评等等合作。背后的逻辑就是:在网购方面信用好的人,也许在婚恋问题上作弊的可能性小。另外,阿里、腾讯两家都收购或者入股了地图公司,那么电商数据能不能和地理位置信息打通,能不能给在支付宝上买了车险的人(肯定是有车族)提供定制服务?支付宝能不能和中石油中石化合作,直接把加油站变成自提点?由此开始畅想,合作机会和可能的商业模式就多得多。
第三,大公司能做所有的事?
一个不得不承认的事实是:只有大公司有做数据基础设施的财力物力和人力。但大公司并不能办成所有的事。大数据的商业价值在于使用大数据的公司做得好,而平台公司诸如阿里、腾讯的意义,就在于提供好用的数据工具和基础设施。
从阿里、腾讯、百度几家做云计算(数据处理的基础)的历程来看,建立自主的,能适应互联网要求、弥补IOE(IBM、Oracle、EMC)弹性差劣势的基础设施,投入在5年以上是一个基本量。阿里云、腾讯曾经的“台风”项目、百度的“金字塔”项目都是历经坎坷,有的逐步走向成功,有的夭折于短期效果和长期效果的平衡中。
家大业大才能玩大数据,但大公司并不能包揽整个大数据时代。原因主要在于:第一,大数据需要盘活,而盘活需要流动、需要共享。不然“大数据”只是“数据大”。而流动和共享则来自于大型平台与多种垂直类网站的合作,更多的,在于和非互联网公司的合作。例如阿里与药监码公司中信21世纪的融合、与中国气象局的合作、与各地政府部门的合作等等。
第二,大型互联网公司的优势在于平台本质:做平台,而不亲自下场做具体业务。对各行业公司来说,数据的盘活和利用在于对行业的深刻理解,这是互联网公司本身所难以达到的。
第四,为什么没有大数据的经典案例出现?
前几年,Google数据预测流感的案例曾被广为传播。啤酒与尿布的案例则是像一块儿铁,在众人的口中生了锈。而各互联网公司用来博眼球的所谓大数据分析球赛、高考作文、春运等,其本质无非是一张Excel表单,只是事后统计,并没有进一步的预测、影响经济决策的作用。
是不是人们对于大数据的效果过于渴求了?是不是互联网公司在人口红利逐渐消失时,对新的商业机会的过于期待了?可以肯定的是,目前,对数据的应用,理解,甚至合理的存储方式,都还处于初级阶段。对于可作为未来核心竞争力的资产,数据并不会像绚烂的烟花绽放,更像空气、水、电,以一种无声的方式浸入和改变世界。
而我们要做的,无非是不要让恐惧排挤了精彩。

- “大数据”还不等于“大智慧”
0评论2015-01-12
七朵云大数据 让百姓生活“棒棒哒”
我省在过去的一年里,围绕电子政务、智能交通、智慧物流、智慧旅游、工业、电子商务、食品安全等多方面全面开展建设“七朵云”;贵阳市更是通过与北京中关村的“京筑”合作,双方在高新区合作建设中关村贵阳科技园,加快脚步推进大数据产业发展。近日记者走进落地的众多高科技项目,体验大数据带来的变化,感受到百姓“新生活”变得“棒棒哒”。
0评论2015-01-1218477

- 2020年医疗健康和生命科学的预测报告:健康大数据无孔不入
0评论2015-01-12

- 大数据商业化 我的隐私成了谁的财富
0评论2015-01-09
探索实践经验分享:大数据如何服务临床
北医三院信息管理中心做了初步探索。探索以临床运营指标、临床质量监控及临床科研分析为主要研究方向的临床智能应用,以患者为中心,以时间为轴线,建立临床事件数据模型,基于事件连续性建立数据集,数据展现围绕临床事件展开。在日前召开的北京卫生信息化大讲堂系列培训上,北医三院信息管理中心主任计虹结合医院自身尝试性建设探索向与会人员做了相关信息的分享。
0评论2015-01-0918045

- 2014年最佳的18张信息图表
0评论2015-01-08
嘉兴:探索大数据时代卫生信息化之路
“自助服务、掌上医院、手机支付宝结算、嘉兴卫生专网……近年来,我市卫生部门在患者、医疗机构和区域医疗体系等三个层面上不断推动信息化建设进程,坚持以互联网思维创新推动医疗改革,在缓解医患矛盾、优化服务流程、提升工作效率、促进资源整合等方面取得了一定成效。”市卫生局副局长沈勤表示。
0评论2015-01-0818272

- 浙江:大数据赋予浙江交通智慧眼
0评论2015-01-08
合肥建设智能交通二期工程 大数据分析交通黑点
BRT公交优先、智能信号灯、对渣土车警车等特种车辆的定位,甚至一块看似普通的交通指示牌上,都凝聚着智能交通的智慧。随着合肥“中国百万人口城市交通系统”(智能交通一二期)项目的实施,合肥正率先进入智能交通城市。现在,下载一个手机APP,就可及时了解交通拥堵信息。未来,每个出行者通过车联网技术,都将成为优化交通的参与者和决策者。
0评论2015-01-0718286
京筑两地再牵手 投资120亿元共建大数据产业园
不断深化的京筑合作再传喜讯。1月4日,贵阳国家高新区与北京市供销合作总社签署协议,决定在贵阳共建大数据产业园。省委常委、市委书记陈刚,北京市供销合作总社党委书记、理事长高守良出席签约仪式并讲话。
0评论2015-01-0618640