ITValue社区

迈入大数据世界 飞速改变商业与生活

作者:ITValue / 日期:2013-11-30

现在,大数据通过前所未有的方式,对海量数据进行分析,并获得深刻的洞见。利用大数据,全球顶尖的智能信息提供商汤森路透可以经济高效地采集客户活动信息,追踪销售机会;丰田汽车能够实现多渠道与客户互动,提升消费体验;Regions 银行降低了IT成本;日本软银集团可以探索客户的隐藏想法,解释和预测客户行为;美国国家癌症研究所得以确定基因与癌症之间的交互关系,深入了解疾病根源……如此种种,大数据正将人们的生活飞速带入未来世界。
根据IDC发布的研究报告,2020年,全球新建和复制的信息量已经超过 40ZB,是2012年的12倍;而中国的数据量则会在2020年超过8ZB,比2012年增长22倍。快速膨胀的数据量促进了大数据技术和服务市场的繁荣发展。研究机构Wikibon也指出,大数据技术和服务市场规模将会从2012年的51亿美元增加到2017年的534亿美元,未来5年的复合增长率更是高达58%。大数据的飞速发展与深化,无疑会为商业与生活带来方方面面的改变。


全面解析大数据生命周期
谈及大数据,不得不提及经典的大数据4V,即数据体量巨大(Volume)、数据类型繁多(Variety)、处理速度快(Velocity)与商业价值高(Value)。的确如此,能给企业带来洞察与价值的大数据技术,需要具备快速分析全部类型的海量数据的能力。而随着大数据应用场景的不断拓展,数据的类型也在由结构化拓展至半结构化和非结构化数据,尤其是来自社交网络的碎片信息,正受到企业极大的关注。为了得到全面、透彻、完善的市场洞察,大数据应完全覆盖传统数据、非结构化数据、流式数据和快数据,共同为企业构建全数据视图,提供全面的信息支撑
尽管如今已有诸多大数据技术手段,诸如分布式计算、并行处理、实时计算、数据可视化、高级分析以及移动商务智能,企业在走向大数据时仍然面临诸多挑战。如何跨越数据“孤岛”,及时获得精准的数据,进而指导企业做出最佳决策并付诸行动,成为企业在大数据领域亟待解决的问题。任何数据,都需要经过获取、存储、处理、分析和利用五大过程,才能最终和业务有效关联,成为切实指导决策与行动的信息要素。围绕这五大过程,大数据可在全生命周期中为企业提供支持。
在最初的数据获取和发掘阶段,企业需要解决的是如何通过数据搜索与可视化,更快地解答有关业务的诸多问题;在数据分析阶段,企业需要良好的平台和性能,支撑随时随地的实施数据分析,监测数据异常与趋势,进一步得出洞见;在最终的规划与预测层面,企业则需结合历史与统计数据,搭建预测模型,最大化预测的精准度,在战略管理以及人财物为决策者提供建议。

多平台共存 大数据由概念转入实践
提到大数据的处理,很多人会首先想到Hadoop。的确,作为被广泛采用的分布式系统基础架构,Hadoop可以实现可靠、高效、可伸缩的数据处理。尤其是其开源、初期投入低的特性,加之当今的企业希望以更快的速度获取更多非结构化数据,Hadoop乃至NoSQL数据库在短时间内都获得了极大的发展。在此之前,即便企业渴望利用大数据,获取海量数据并进行实时分析的高昂成本也令人望而却步。可以说,Hadoop和NoSQL的出现大大改变了数据应用的现状。
然而,企业已经意识到Hadoop并不是大数据的代名词,主流的SQL关系型数据库正在回归大数据主流世界并在大数据处理和分析领域继续发挥重要的作用,极大程度上完善了大数据的生态环境。由于Hadoop、NoSQL和SQL的共存与融合,大数据技术在成熟度方面将迈入全新的一步。随着内存、移动以及虚拟化技术的不断发展,大数据也正在从一个无形的概念逐渐走向落地实践。在中国,从互联网企业,到电信、金融、政府这样的传统行业,都已开始采用各种大数据分析和服务,帮助企业聆听客户之声、品牌传播、市场优化、风险分析、优化决策等方面。


卓越性能赢得客户高度认可
凭借全面、软硬一体化、高性能和高性价比的突出特点,目前,Oracle大数据解决方案已获得众多企业用户的支持,前文所提及的汤森路透、丰田汽车、Regions 银行、美国国家癌症研究所等等,都通过部署Oracle大数据解决方案,简化了IT架构,达成了更好的业务目标。
由美国国家癌症研究所(NCI)资助的Frederick国家图书馆,借助Oracle大数据机及其Apache Hadoop(CDH)Cloudera分区,实现了 2000万生物样本间进行17000个基因与五大癌症亚型的关系对照检索,从而赢得了2012 年政府大数据解决方案奖。
全球知名的汽车工业公司丰田汽车通过采用Oracle 大数据机、Oracle大数据连接器和Oracle Endeca Information Discover等产品,能够更好的利用下一代车辆遥测技术预测组件故障,并发现组件故障之间的相互关联。同时它借助社交媒体、市场调查和与经销商的互动,进一步提升了客户好感度,改善了用户体验。
如何正确的利用数据对于汤森路透这样的智能信息提供商来讲显得至关重要。通过Oracle大数据解决方案,汤森路透能够更加经济的采集所有客户活动的信息,并以5000万个事件/秒的摄取率,测试进入大数据机和Oracle NoSQL数据库的数据,同时向Oracle Exadata馈送数据,以方便客户进行盈利和分段分析。Oracle大数据解决方案的部署帮助汤森路透实现了最大限度地增加交叉销售的机会,并降低运维成本和系统复杂性。
甲骨文公司副总裁及大中华区技术总经理喻思成表示:“大数据已经和云计算、社交化、移动化一起,深入人们生活的方方面面,也成为现阶段驱动企业IT模式变革的重要因素。Oracle大数据解决方案可以横跨IT架构的所有层面,与其他产品进行创新集成,能给企业提供卓越的可靠性、可扩展性和可管理性,帮助企业在未来的竞争中立于不败之地。”

推荐阅读