什么是大数据
大数据(Dig Data)是继物联网、云计算、移动互联网之后又一个热门的科技概念。目前无统一说法。根据维基百科的定义,它是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理、处理的数据集合。从产业角度,常常把这些数据与采集它们的工具、平台、分析系统一起被称为“大数据”。
最早提出“大数据时代已经到来”的机构是全球知名咨询公司麦肯锡。其在报告中指出,“数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素;而人们对于海量数据的运用将预示着新一波生产率增长和消费者盈余浪潮的到来。”
维克托·迈尔-舍恩伯格教授在书中谈到“首先,大数据改变了我们的思维方式,让我们从因果关系的串联思维变成了相关关系的并联思维。第二,大数据改变了我们的生产方式,物质产品的生产退居次位,信息产品的加工将成为主要的生产活动。第三,大数据改变了我们的生活方式,我们的精神世界和物质世界都将构建在大数据之上。”
2013年被称作是中国大数据时代元年,随着技术上的进步以及大数据的运用,我们正在加快步入大数据时代。
大数据时代对政治生活影响
1.开放的政府。
数据技术变革,何以能推动政府信息公开、透明和社会公正?
列宁曾说过“没有公开性而谈民主制是很可笑的”。人民行使管理国家的权力,是以对公共事务的充分了解为基础的。目前政府作为国家各种数据信息资源的最大拥有者,已掌握全社会信息总量的大约80%,这些信息常比一般信息更有价值,也直接关系到国民经济与社会发展的状况与水平。大数据时代能加强对信息的整合、共享与利用,推行政府信息公开也成为世界各国的普遍趋势。
政府作为国家行政机构,承担着大量公众事务的管理和服务职能。二十世纪的公共哲学认为,政府行政的最大目的在于提供公共服务。各级政府部门拥有大量宝贵的信息资源在大数据时代有望通过技术手段打破狭小的封闭圈子,从而为社会提供各种需要的数据资源,公众、企业和社会获取政府有关政策法规、各类统计信息、社会保障信息等的快捷和透明程度也会提高,数据信息的大众化使人们能够同样获取有价值的信息,一定程度能够促进社会的公正。
2. 决策科学的政府
除了上帝,任何人都必须用数据来说话。“大数据”时代来临决策不能只凭经验,而是通过大量可靠数据的分析来提高决策的科学性和有效性。
在传统政务中,管理决策的基础是由西蒙提出的有限理性学说,信息的有限性是影响人们进行理性决策的直接原因之一。现代办公模式需要适应现代社会信息量巨大,各种因素、条件纷繁复杂的特点,作为政府领导,要做出正确的决策,需要掌握的信息、资源越来越多,大数据时代通过建立决策支持系统,为政府决策者提供必要的决策信息,改善决策者的有限理性,使决策者在全面了解决策所需信息的前提下进行决策。同时,大数据下的政府使决策实施情况的及时反馈成为可能,决策是否正确只有在实践中才能得到验证,如果决策失误,可以通过反馈信息不断修正和完善。依靠政府部门掌握的大数据,及时获得决策实施过程中的反馈信息,了解和掌握发展变化的最新信息,并据此完善或追踪决策。
过去,我国的行政决策依赖地方政府和有关部门提供的资料,其中包括一些数据,有的甚至非常详尽,但由于取得数据的方式不是直接源于市场和社会大众,再加上一些数据“掺假”,导致政府的决策科学性不强。大数据时代数据来源广泛和直接,通过科学方法分析整理可以直观和准确地反映社会实际,有利于决策的针对性和科学性,同时能够有效配置社会资源,防止决策盲目造成的与实际脱节现象。
3.高效快捷的政府
在大数据时代政府部门获取、传输、应用数据来进行管理和服务的能力将会得到很大的提升,也能避免许多环节技术上或人为的差错。
政府工作人员提供了现代化的办公手段和应用工具,降低了信息传输的时间成本和人力成本,节约了原来靠人脑和文件处理信息所消耗的大量时间和精力,将政府工作人员从常规的事务性工作中解脱出来。依托网络技术打破了政府工作的时空界限,加强了政府部门之间以及政府与公众之间的信息沟通和互动,使以前无法想象、无法实现的政府服务成为现实,使政府管理和服务更加精干高效。
4.更加广泛的政治参与
一方面,随着大数据时代的到来,政府在财政预算决算、“三公”经费等大量数据信息也会逐渐揭开神秘面纱,网络、微博问政方兴未艾,既让政府信息越来越走近百姓,又通过公众和社会力量的介入,对政府的决策和监督施加影响。
另一方面,现在很多人从早上起床到晚上就寝,都是以浏览手机开始,以阅读手机结束。用于网络的机会和时间越来越多,自然成为制造各类大数据的强大来源。大数据时代下的民意,只可能比以往任何时候都复杂多变。越来越多元化的新媒体及其运作模式,为人们提供了更多、更便利的发声渠道,这些声音来自社会各个阶层。
大数据与公民个人隐私
有项调查显示大多数受访者表示不希望企业存储个人数据,特别是反对企业追踪自己的上网记录。主张保护数据隐私的人认为,“大数据”理念其实与“专制独裁”没有区别。为消除人们顾虑,许多公司强调他们收集、储存、分析数据都是“匿名”,但事实上可能并非如此。在线期刊《科学报道》近期一项研究显示,每个人有自己的行动模式,95%的人可能被识别。普林斯顿计算机科学家阿尔温德?纳拉亚南在其博客上说,可供分析的数据越多,就越不可能保持“匿名”,识别一个人只要33个字节的信息量。
安全领域是“大数据”应用增长最快的领域之一,施罗德说。除对付犯罪和恐怖主义外,Splunk的软件还能查明黑客攻击等网络犯罪。该软件输入了警方所有数据,不断更新,用于计算何时何地可能发生夜盗、抢劫、偷车等犯罪行为,其中三分之二切实发生了。美国“棱镜”计划始于2007年,主要用于监控恐怖主义活动,“9· 11”带来的恐慌情绪使美国安全部门获得了巨大的权力,“棱镜”只是诸多监控项目中的一个。美国情报机构一直在九家美国互联网公司中进行数据挖掘工作,使现代社会中每个公民都置于它的监视之下,且任何措施都不能保证你的安全,这是政府侵害公民自由的一个例子。
这同时表明,在大数据时代可能意味着个人的空间的被挤压,各种数据的被记录和追踪会使得个人毫无隐私可言。
需要警惕“数据暴政”
一份由奥美公司所作的调查报告显示,75%的人不希望企业存储自己的个人信息,有90%的人反对企业收集自己上网浏览网页的记录。
微软研究院的高级研究员博伊德曾表示:“如今,我们社交网络化的社会绝对有制造恐慌的天分。在大数据时代,对隐私泄露的担忧就是强大的紧张和焦虑的源泉。人们普遍认为,最令人焦虑的在于你根本不知道什么时候自己的隐私就无意中被泄露出去。”
人们最担心的,是对这种数据的无限制利用。美国畅销书《爆发》中指出,人的行为看似随机无序,但实际上是存在某种规律的。社交网络如此发达的今天,大数据把人的行为进行放大分析,从而能够相对准确地预测人的性格和行程。所以,不排除有这样一种可能:在忙完了一天的工作之后,你还没有决定要去哪儿,数据中心却早就先于你准确预测了接下来的目的地。
这向我们提出警醒:大数据时代,如何界定大数据的权益归属?如何控制大数据的使用风险?如何保持我们全社会的数据民主?
互联网哲学家叶夫根尼·莫罗佐夫对许多“大数据”应用程序背后的意识形态提出尖锐批评,警告即将发生“数据暴政”。他提出,那些“大数据”应用程序应当接受独立审计人定期审查,以防权力滥用。
大数据时代就是好的?
从媒体和政治的关系来看,透过媒体传播信息以及因此生成的观点、分享等传达出海量信息,而人们对事件的关注、看法与评论,又有着短暂、零碎的特质,从而构成庞大而混杂的大数据,执政者需要进行科学而量化的分析,以成为勘察和了解民意的重要途径。
大数据时代一个特征是数据价值密度相对较低,如随着物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低。在网络时代,一方面是信息快速、自由的流动,一方面也不断制造着信息的碎片化、歧义化,民意迅速、大量的爆发式呈现,事件真正的来龙去脉,只能在碎片化中逐步厘清,但同样可能存在网络话语权从属于强势的声音。在信息传递过程中,事件往往出现不止一个“版本”或被扭曲的现象,变得不可控、或者暗箱操控。一个民生课题在各方民意万马奔腾的发酵效应之下,极有可能引发公共危机,甚而影响政府决策。这些量化、细化的大数据分析,结果未必全然是理性的。
大数据时代的政治
美国的国会政治已经进入到了精算阶段。不仅仅是 K 街的游说集团基本能完全预测各个议员的投票情况,民间的组织和统计学家也能预测到。阳光基金会不但有手机上的 App 可以让网民下载,还有向开发人员提供国会数据的公开 API,可以仔细分析各个议员的投票历史、政治捐款行业分布、所在选举数据。但政治数据本身是被动的,只能如实反映潜在的政治变动和危机,如何解决,依然要靠卓越的政治领导力。
人们对于与大数据、数据挖掘相关的政治问题的关注不应仅停留在隐私权的保护、商业规范的制订等方面。通过比较福柯所论述的规训时代与大数据时代的异同,可以发现大数据创造了以抽象的深层次身心机制为特征的新权力客体。统治者能够借助非系统化的海量信息对社会各个职能领域进行细节化的监控和管理。这种统治模式虽然可能造成民主危机和责任危机,却也蕴含着向有利方向变革的可能。实际上,大数据的合理利用,不仅需要技术的进步,更有赖于人们各方面素质的提高,以及政治意识的增强。