分享好友 城市规划首页 城市规划分类 切换频道

神奇的大数据!微软几乎猜对所有奥斯卡大奖

2013-02-26 08:374250驱动之家
David Rothschild是微软纽约研究院一名经济学家,在2012年美国总统大选中,他正确预测了51个选区中50个地区的选举结果,准确性高于98%。不久前,David Rothschild通过大数据分析,对第85届届奥斯卡各奖项的归属进行了预测。

北京时间今日上午,第85届奥斯卡金像奖颁奖礼在美国好莱坞举行,《逃离德黑兰》摘得最佳影片奖,李安凭借《少年派的奇幻漂流》获得最佳导演奖,其它各项大奖也都尘埃落定。

那么这次David Rothschild的大数据预测准不准?答案令人称奇,微软大数据分析堪称预言帝,除最佳导演外,其它各项奖预测全部命中。

David Rothschild预测的最佳导演奖得主是斯蒂芬·斯皮尔伯格(Steven Spielberg)(影片《林肯》),而最终拿下该奖项的华裔导演李安。

第85届奥斯卡主要获项获奖名单:

最佳影片:《逃离德黑兰》Argo

最佳导演:李安 Ang Lee(《少年派的奇幻漂流》 Life of Pi)

最佳男主角:丹尼尔·戴-刘易斯 Daniel Day-Lewis(《林肯》 Lincoln)

最佳女主角:詹妮弗·劳伦斯 Jennifer Lawrence(《乌云背后的幸福线》 Silver Linings Playbook)

最佳男配角:克里斯托弗·瓦尔兹 Christoph Waltz(《被解放的姜戈》 Django Unchained)

最佳女配角:安妮·海瑟薇 Anne Hathaway(《悲惨世界》 Les Miserables)

最佳动画长片:《勇敢传说》 Brave

最佳歌曲:《Skyfall》(《007之大破天幕杀机》 阿黛尔 Adele)

想进一步了解David Rothschild的大数据分析模式?请看下面CNET对于其预测理念的报道:

David Rothschild表示:“我预测奥斯卡金像奖得主的方法与预测其它事情的方法完全相同,其中包括政治。首先关注最有效的数据,然后创建不受任何特别年份结果干扰的统计模型,所有模型都根据历史数据进行测试、校正,我们在建模时很有耐心,确保模型能够正确预测外样本结果,而不仅仅是过去发生的结果。我们创建的模型是能够预测未来的,而不只是过去发生的。”

他指出:“科学是相同的,但证明哪些数据最有用却存在千差万别。”

你或许会认为一个能够攻克选票近1.27亿张变化莫测总统大选的预测模型也一定能够在预测不太复杂的事件中轻松获胜,如奥斯卡投票,其投票成员不足6000人,但美国总统大选与奥斯卡投票采用的数据大相径庭。

David Rothschild透露:“我通常关注四个不同类型的数据:投票数据、预测市场数据、基本数据和用户产生的数据。在预测政治时,我采用基础数据如过去的选举结果、义务和经济风向标。通过基础数据建立一个基准,然后转向预测市场数据和投票数据,因为这两个类型的数据吸收并包含了更多选举信息。2012年总统大选预测时,我使用了少量用户产生的数据,但Xbox Live数据对补充重大事件实时分析起了关键作用。”

“预测奥斯卡金像奖花落谁家时缺少民意测验投票数据,而基本票房回报和电影评分等数据也很难有效统计。我更关注的是预测市场数据,这是主要因素,同时采用部分用户生成内容的数据分析,这有助于理解电影内部和不同类别之间的相关度,例如影片《林肯》会赢得多少个奖项?”David Rothschild说。

David Rothschild强调:“每当我关注一个新领域,我都会认真考虑一些关键事情,确保自己的预测更有意义。”

首先,我会确定最中肯的预测。至于奥斯卡金像奖得主预测,我关注的是所有24个类别的获胜概率,并会预测各个类别主流电影的总奖项。

其次,我的所有预测结果会实时更新。从研究观点看,实时更新预测结果至关重要,我们能够获悉最初预测与最终事件之间发生的不同事件的价值。这些事件就是奥斯卡奖项归属的前奏。

最后,我借助特定领域的历史数据建模,然后通过不断升级模型确保预测的准确度。我还想强调的是,我们所做的一切都是为了尽可能保证领域独立性,确保所有问题的可衡量性。如果该研究能够催生出更高效的预测方法、在众多领域适用于大量问题,将对微软、对学术界和这个世界都有价值。”
举报
收藏 0
打赏 0
2013中国大数据峰会即将召开
作为国内大数据领域最权威、最顶级的会议之一,由中国电子信息产业发展研究院(赛迪集团)主办,《软件和信息服务》杂志社和赛迪智库软件与信息服务业研究所联合承办的“2013中国大数据峰会”将于2013年10月18日在北京西苑饭店隆重召开,本次会议的主题是“拥抱大数据时代”。    

0评论2013-09-051745

运用大数据治理北京“最堵月”
据测算,北京9月将有9个重点拥堵日,堪称“最堵月”。当地已正式实施相关专项行动方案,规定在重点拥堵工作日及晚高峰降雨等特殊天气,各企事业单位可实施弹性工作时间。

0评论2013-08-29890

中国第一个大数据产业园成经济发展助推器
大数据正在成为业界概念炒作的焦点,但任何一个技术概念都需要“落地”——先进技术只有与产业集合,并切实推进经济的发展,才能成为真正的生产力。

0评论2013-07-311175

第十届中国运营支撑暨大数据产业年会(CBC2013)在京圆满落下帷幕
2013年6月18-19日,第十届中国运营支撑暨大数据产业年会(CBC2013)在北京圆满落幕,本次大会由中国计费网主办,以“变革力、创新力、发展力”为主题,以“重新定义中国信息化,开放、创新、突破传统思维,直击大数据和云计算商业价值蓝海”为目标,回顾了中国运营支撑十五年的产业变革,并对当前IT关键技术大数据展开深入探讨,就其带来的价值和挑战进行了深入分析。会议邀请全国各地的多名运营支撑领域的专家学者、运营商、集成商、服务商参加了会议。

0评论2013-06-26908

中国运营支撑及大数据产业年会(CBC2013)召开在即
CBC2013(即中国运营支撑及大数据产业年会)是由中国计费网主办的一个供运营支撑人和IT人交流和沟通的多元化平台,已成为中国BSS/MSS、OSS领域最具影响力的专业媒体咨询平台。

0评论2013-06-14798

重庆启动大数据发展战略
5月8日下午,市经信委、中国联通和北京磊强科技有限公司(以下简称“北京磊强”)在大礼堂酒店联合召开“融信通”产品说明会。记者从会上获悉,重庆市将启动大数据发展战略,到2017年,全市在大数据领域将形成至少500亿元的产业规模。

0评论2013-05-09846

中关村扩大规模调布局 大数据发展与硅谷同步
祥云基地、中关村云计算产业基地、中关村云广场……在一年时间内,中关村软件园已经多了三个和云计算有关的“头衔”。作为国内互联网产业的发源地和创新高地,一向在新兴产业领域处于领先地位的中关村,这一次把目光瞄向了云计算、大数据。

0评论2012-12-18504