分享好友 资讯头条首页 资讯头条分类 切换频道

当大数据遭遇云计算

2011-12-21 11:4710910智慧城市网
大数据正在彻底改变IT世界。那么,什么样的数据谈得上数据呢?

根据IDC的报告,未来十年全球大数据将增加50倍。仅在2011年,我们就将看到1.8ZB(也就是1.8万亿GB)的大数据创建产生。这相当于每位美国人每分钟写3条Tweet,而且还是不停地写2.6976万年。在未来十年,管理数据仓库的服务器的数量将增加10倍以便迎合50倍的大数据增长。

毫无疑问,大数据将挑战企业的存储架构及数据中心基础设施等,也会引发云计算、数据仓库、数据挖掘、商业智能等应用的连锁反应。2011年企业会将更多的多TB(1TB=1000GB)数据集用于商务智能和商务分析;到2020年,全球数据使用量预计暴增44倍,达到35.2ZB(1ZB=10亿TB)。

大数据面临的挑战——RISC已无法满足未来的企业架构需求

对于海量的数据信息,如何对这些数据进行复杂的应用成了现今数据仓库、商业智能和数据分析技术的研究热点。数据挖掘就是从大量的数据中发现隐含的规律性的内容,解决数据的应用质量问题。充分利用有用的数据,废弃虚伪无用的数据,是数据挖掘技术的最重要的应用。传统的数据库中的数据结构性很强,即其中的数据为完全结构化的数据,而目前数据最大特点就是半结构化,因此此类数据挖掘比面向单个数据仓库的数据挖掘要复杂得多。

谈到传统数据仓库的时候,大家不免就会买存储设备,选服务器,不管是IBM Power或者是Oracle架构的,这些其实都是在传统时代非常有名的数据库品牌,把它构建在一起,构成数据仓库,微软、COCNOS等都提供解决方案。

但从目前来看,现有的数据仓库已经远远不能满足未来的企业大数据架构。

对企业业务来说,不光要有高扩展性,而且是动态的需求,能够让设备自由扩充,不用去管数据仓库、应用具体运行在这些机器的哪一台上,这些计算能力的耗费完全是根据业务的伸缩而来的。

传统的架构做这类的项目十年到二十年的时间,它们有一个特点,数据仓库的访问和传统的不同,所谓的不同就是查询特别大,查询的语句特别长、特别复杂,不像去银行的存提款只是在众多的记录中查询一两条,它符合大数据查询的特征,传统的查询索引作用非常有限。在数据库中涉及多张表的连接,同时还有汇总、算标准差等复杂的运算。但是相反它的并发请求不是很多,一个企业就是人再多,不会同时超过一千个业务分析员在分析数据。

因此,在数据仓库诞生的第一天,系统一直就有一个瓶颈,要把大查询分解成小任务,这些小任务由并行的服务器来完成,我们强调小的机器要多,而不要大的机器CPU数少。因此,数据仓库天生就是MPP、开放架构的CPU加上并行扩展横向扩展数量,从这方面来看,扩展性较差,并行处理能力有限的RISC架构已经不能代表未来的企业架构。

而以英特尔为代表的X86处理器天生就是为大数据应用而生,Oracle推出的Exadata数据仓库服务器采用了英特尔至强(Nehalem)处理器、DDR3内存和40Gbps InfiniBand,Exadata数据库机第二版的CPU、内存和网络速度分别提高了80%、200%、100%,单个数据库服务器内存容量则达到了72GB,原始磁盘容量和每机架磁盘容量达到100TB、336TB,Sun FlashFire内存卡则实现了高性能的OLTP。

当大数据遭遇云计算

云计算为什么能盛行呢?在互联网领域应用系统的构建:客户群体是不确定的、系统规模不确定、系统投资不固定、业务应用有很清晰的并行分割特征、数据仓库系统的构建、数据仓库规模可估算、数据仓库的系统投资与业务分析的价值和回报相关、商业智能应用属于整体应用、Saas模式构建数据仓库系统。

在大数据技术上用云计算构建下一代数据仓库成为热门话题,这当中包括大数据管理,分布式进行文件系统,如Hadoop、Mapreduce数据分割与访问执行;同时SQL支持,以Hive HADOOP为代表的SQL界面支持。从系统需求来看,大数据的架构对系统提出了新的挑战:

1、集成度更高:这意味着一个标准机箱最大限度完成特定任务,华硕不久推出的一款高密度机架式服务器RS720,2U高度最大能采用支持4个双路计算节点,实现单机8个英特尔5600系列处理器和高达总计768G内存资源。

2、配置更合理、速度更快:存储、控制器、I/O通道、内存、CPU、网络均衡设计,针对数据仓库访问最优设计,比传统类似平台高出一个数量级以上,这方面的经典案例是数据仓库头号厂商Teradata,其采用双路Xeon六核处理器的企业级数据仓库5650可轻松为数千名用户处理更复杂、更大量的工作负载、持续负载以及批负载、操作性查询、简单报表和复杂的分析,所有功能均在同一个平台上运行。与上一代产品相比,动态企业级数据仓库5650的性能提高了43%,占地面积保持不变,减少了能源消耗和空间需求。

3、整体能耗更低:同等计算任务,能耗最低。

4、系统更加稳定可靠:能够消除各种单点故障环节,统一一个部件、器件的品质和标准。

5、管理维护费用低:数据藏的常规管理全部集成。

6、可规划和预见的系统扩容、升级路线图。

云计算环境作为大数据处理平台

1.云计算环境中基本计算单元的分化

企业云计算平台上虽然有多个并行计算的CPU,但并没有创造出具有超强数据处理能力的超级CPU,因此云计算平台需要的是有并行运算能力的软件系统。同时,当所有用户的数据全部放在云端时,虽然存储容量可以很方便地扩充,但面对大量用户同时发起的海量数据处理请求,简单的数据处理逻辑已经无法满足需要。

可以看到,国内有相当多的电商企业,用小型机和Oracle扛了好几年,并请了全国最牛的Oracle的专家不停优化他的Oracle和小型机,初期发展可能很快,但是后来由于数据量激增,业务开始受到严重影响,最典型的例子无疑是京东商城前段时间发生的大规模访问请求宕机事件,因此他们开始逐渐放弃了Oracle或者MS-SQL,并逐渐转向MySQL X86的分布式架构。

目前的基本计算单元常常是普通的X86服务器,它们组成了一个大的云,而未来的云计算单元里有可能有存储单元、计算单元、协调单元,总体的效率会更高。

2、对系统稳定性的需求

在应对大规模访问的时候有一些系统稳定性的追求,来自很多方面,来自网络稳定性、数据库稳定性。对系统而言,需要把握一个大原则,需要消除任何单点故障。不光是网络上单点故障,还有来自你呼叫中心里的单点故障,只要有单点故障一定要消除掉。因为对于电商行业而言,每一秒都是钱,电子商务业务如果宕机一个小时,损失多少是可以算出来的,电商行业需要非常全面的技术系统监控报警系统。有时候你会发现你如果通过技术系统的监控去推导出你的技术发生问题已经晚了。
举报
收藏 0
打赏 0
评论 0
宿州:发展云计算 驾上“筋斗云”
谁能想到,传统农业大市宿州,会拥有两个具有全国影响的云计算产业园——由宿州市政府与纳斯达克上市公司“世纪互联”合作的“宿州智慧云计算产业园”,以及由中科院云计算中心建设的“中科云智慧(宿州)产业园”。前者总投资76亿元,是中国在建的最大云计算数据中心;后者总投资80亿元,是由中科院落实国家云计算产业发展战略总体要求,国家发改委统筹总体规划、指导全国布局的首个云计算产业示范园区。

0评论2015-01-091520

今年我区大力推进云计算产业发展
近日,经国务院同意新疆12个项目被列为2014年国家重大工程,乌鲁木齐市云计算产业园建设项目位列其中。据悉,云计算产业园位于乌鲁木齐经济技术开发区(头屯河区),主体建筑2013年底完工。目前,乌鲁木齐云计算产业园正在积极吸引企业入驻,力争打造成促进新疆经济和社会发展的重要技术支撑平台。

0评论2015-01-071420

清远拟建云计算电子政务公共平台
2014年12月22日的市政府常务会议审议通过的《基于云计算的电子政务公共平台建设和应用试点示范工作方案》(下称《方案》)提出,改造完成后,各单位无“云化”改造条件的数据中心不再扩建或改建,市级各部门不再新建机房和独立的数据中心。

0评论2014-12-24998

电子政务建设急需国家级“专有云”
我国政府向公共服务型政府的转型,对电子政务建设提出了更高要求。特别是十八大将信息化列为“新四化”(新型工业化、信息化、城镇化、农业现代化)之一,意味着信息化将成为推进我国经济社会转型的核心力量之一。当前,新一代移动通信技术、云计算、物联网等新技术、新应用不断涌现,深刻改变了电子政务发展环境与条件。云计算技术以其虚拟化、可扩展、可靠性等优势,在推动电子政务基础设施共建共享和共用、提高资源利用率、减少重复建设以及节能减排等方面,发挥着越来越重要的作用。

0评论2014-12-181133

贵州省交通运输厅扎实推进“智能交通云”建设
“智能交通云”是贵州“7+N”云工程建设的重要组成部分,以培育大数据产业为核心,着力提升“智慧交通”的管理水平和服务质量。

0评论2014-12-171132

宿州:云计算助力加速度崛起 科技创新驱动经济
瞅准科技进步和新兴产业的发展潮流,短短两年间,宿州市平地兴起总投资160亿元的两大云计算产业园,为经济发展注入新动力。今年前11个月,仅宿州高新区云计算产业园就实现产值2.6亿元。

0评论2014-12-162010

乌鲁木齐云计算产业园吸引企业入驻
在2014年国家重大工程中,乌鲁木齐云计算产业园建设项目位列其中。乌鲁木齐云计算产业园位于乌鲁木齐经济技术开发区(头屯河区),主体建筑已于2013年底完工。目前,乌鲁木齐云计算产业园正在积极吸引企业入驻,力争打造成促进新疆经济和社会发展的重要技术支撑平台。

0评论2014-12-112473

重庆:政府购买云计算服务推全市信息化建设
记者近日从重庆市政府常务会上获悉,为降低政府信息化建设、运营成本,提高服务效率,重庆将采用政府购买云计算服务方式推动全市信息化系统集约化建设,各单位不再单独新建信息化系统。   

0评论2014-12-111906

金山斥资10亿美元推云计算
金山软件昨日宣布计划未来3-5年以10亿美元投入云服务,而其第一步联合小米、淡马锡投资电信中立互联网基础设施服务提供商世纪互联刚于近日完成。这笔巨额投入也表明了金山进军云领域的决心。

0评论2014-12-041081