2015年有关hadoop的10个预测 -pg电子游戏网站

2顶
0踩

2015年有关hadoop的10个预测

2015-03-20 15:49 by 副主编 mengyidan1988 评论(1) 有7706人浏览
计算及商业评论杂志给出了2015年hadoop的10个预测。既包括了企业端的hadoop(增长率,整合),也包括了技术整合,像spark vs hadoop和sql for hadoop。

这是你需要了解的2015年大数据分析工具的指南。

1.市场份额增长至$2.2bn

根据marketanalysis.com的分析,在未来的五年内, hadoop-mapreduce市场预计将达到22亿美元,复合年增长率高达58%。

该研究公司把增长的原因归结为对海量数据的存储分析以及主要供应商提供的成本高昂的定价模型。

地区经理peter walker在 information builders 上说:“这种增长的关键驱动因素是来自多个数据源多种格式的结构化和非结构化的企业数据急剧增加。这就是为什么我们最近宣布与众多pg电子游戏网站的合作伙伴联合起来的原因,这些伙伴包括:cloudera、hortonworks、hp vertica,、mapr 和pivotal。”

这也符合了今年早些时候idc的研究,研究结果预测全球hadoop-mapreduce市场营收将从2011年的$77m增长至2016年的$812.8m(译者注:m为百万)。

2.整合

hadoop在技术成熟的生命周期中还相对年轻,自谷歌开创性的发表了mapreduce白皮书后,也才过去十年,据mapr ceo和创始人之一—— john schroeder说。

“hadoop在创新阶段,供应商错误地采用“red hat hadoop”策略,好在已经退出市场,显而易见与intel和emc整合更加重要”,他说。

“2015年,开源软件的新模型将会继续演化、愈加微妙,它将使深度创新与社区发展两者结合在一起。”

3.hadoop vs 传统数据库,mysql和数据仓库

splice machine的联合创始人兼ceo(首席执行官)—monte zweben说,企业对于hadoop的实时性和事务处理方面有强劲的需求,因为它可以替代传统数据库供应商,像oracle、mysql。他说:“hadoop将继续扩展其工具集,以替代传统的rdbmss(关系型数据库),mpp 数据库,etl 工具和数据仓库。”

actian公司cto(首席技术官)—mike hoskins补充道:“数据的类型、来源和数据量都在不断的增长,对那些感兴趣的数据进行大量分析,再根据结果数据的关系、图表预测未来的趋势,以满足不断变化的业务需求。”

“企业需要数据分析的基础设施,可以从任何数据源中抓取任意类型、大小的数据,传送到hadoop中,然后让各种分析引擎从中读取数据,并使用各种先进的技术来分析数据,预测未来一段时间内对业务产生的影响。”

4.昂贵的成本会降低使用率

自动化公司automic的cmo(市场总监)——chris boorman告诉cbr,很多例子证明采用hadoop成本太过昂贵且费时。

他说:“尽管像hadoop这样的技术在实时处理和经济预测性方面是可行的,但是最终获取的结果是有所限制的,因为需要和现有的一些企业工具集成,才能提供真正的业务洞察力和价值。”

“此外,企业要实现hadoop的话需要雇佣一些hadoop专家来帮助编写软件和搭建整个系统。这些专家的需求是非常大的,所以非常昂贵。而且他们会写一些自定义的脚本,这相当于又给代码库增加了一些额外的技术债。”

5.cloudera 和 marketlogic将为成为大数据市场的领导者

fujitsu  uk & ireland(英国&爱尔兰)地区(首席技术官)——jon wrennall告诉cbr:“在2015年,我们将继续看到cloudera和marklogic这些基础上建立的数据聚合平台承载更多的传统事务性数据,蚕食rdbms供应商的份额。”

richard noble是tangent snowbal(一家数字代理公司)的技术总监,告诉cbr:“基于hadoop的支持度(sap,亚马逊,微软,sas都提供了基于hadoop的pg电子游戏网站的解决方案),感谢hadoop开源项目的本质,我认为短时间内不会出现一个有威胁的竞争对手。”

“无论你使用构建在hadoop之上的任何工具,市场领导者将会提供一个最简单的界面来处理大数据。”

6. apache spark vs hadoop

idc 欧洲大数据&分析研究主管——alys woodard告诉cbr说:“替代hadoop的产品将要出现,从apache spark的使用率上升可以看出即时性是很重要的。”

然而,couchbase公司的pg电子游戏网站的解决方案架构师mohammed haji博士说:“市场上有很多工具,要么是非常高昂的价格,要么无法处理海量的数据,hadoop可以满足这些。”

“我们已经看到很多优秀的厂商将hadoop和它们的工具进行集成,过去它们以声称能处理bigdata而出名,现在它们竞相说自家的工具已完全和hadoop集成。”

7. skills shortage will disappear

据forrester research公司推测,随着企业转向他们现有的应用程序开发团队实施项目,hadoop技术短缺的情况将很快消失,如填充数据湖泊和使用java开发mapreduce作业。

forrester公司的应用程序开发分析师mike gualtieri说:“对于那些熟悉商业智能的人,基于hadoop的sql提供了一种熟悉的方式让他们去访问数据。尽管经验丰富的技术管理专业人士不畏困难,开源社区和商业供应商正在创建更好的工具,使hadoop容易上手。”

他补充道:“cios(首席信息官)不必雇佣高价的hadoop顾问来完成项目,因为企业的应用程序开发人员和运营专家更了解数据,系统集成点和业务的一些挑战,所以hadoop项目能够更快的完成。”

“对于需要一些额外技能的复杂应用程序,比如用hadoop来做预测分析,可以在需要的时候再创建。”

8.易用性

splunk公司emea(欧洲、中东和非洲)区营销主管matt davies说:“随着使用hadoop分析数据更易用,更主流。企业中的任何一个人都能利用软件实时的从hadoop中获取业务洞察力,将企业数据开放给一个全新的观众。关键这是一个自助分析的能力,可以让任何人从大数据中得到答案,无论这些人的工作角色和对技术的了解程度。

他补充道:“我们可以看到像aws这种执行现收现付价格计划的供应商越来越多,这意味着初始投资在软件、基础设施以及技术方面的资金可以最小化。公司可以自由的使用hadoop来实验,并通过大数据服务来展示roi(投资回报率)和评估一个更大的投资回报。

9. 2015年将大规模部署

451research公司数据平台和分析研究主管matt aslett说:“虽然我们看到大家对hadoop有着极大的兴趣,早期由开发人员和shadow it或者创新实验室来开发一些独立的应用程序。”

“不过这已经开始发生变化,早期尝鲜者正在将这些战略性项目从poc(概念验证)转为产品,高级it主管为大规模部署大开绿灯,以扩展数据存储、处理和分析能力。我们预计这一趋势将在2015年早期继续扩大,晚期多数将开始行动起来。”

10.2015年sql将成为hadoop的杀手级应用

根据forrester研究,sql——程序开发人员所使用的数据查询语言工具,将成为hadoop生态系统中最有用的工具之一。

forrester的mike gualtieri说:“基于hadoop的sql创造了一个直接的机会,成为对企业有用的数据平台的机会。ad&d专家已经了解sql和许多能与之交互的技术。当然hadoop和sql相比,前者有更多的用例,但是许多企业会从基于hadoop的sql开始,因为它更简单。”

actian的cto(首席技术官)mike hoskins补充道:“将hadoop转变为一个高性能、功能完整的分析平台,业务分析师可以通过sql方便的访问hadoop中的数据。随着越来越多的企业意识到这种需求,一些业内厂商可能会因为松散的集成或者提供不成熟的sql-on-hadoop方案而丢失市场份额,而那些能提供足够性能、规模、成熟度和端到端能力的企业将会完成期待已久的承诺——使用hadoop处理大数据。”

来自:
来自:
2
0
评论 共 1 条 请登录后发表评论
1 楼 2015-03-20 16:56
it技术翻新好快,完全跟不上节奏

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • 2.1 hadoop 十年解读与发展预测 2.1.1 年史篇 2.1.2 技术篇 2.1.3 产业篇 2.1.4 应用篇 2.1.5 展望篇 2.1.6 编者篇 2.2 docker on yarn 在hulu 的实现 2.2.1 设计动机 2.2.2 架构设计 2.2.3 编程模型 2.2.4 容错...

  • 到现在,这个单词代表的是“核心”(即core hadoop项目)以及与之相关的一个不断成长的生态系统。这个和linux非常类似,都是由一个核心和一个生态系统组成。下图展示了hadoop最近十年的发展: hadoop编年史 •...

  • 文章目录hadoop 编年史技术篇存储...下一代分析平台下一个十年后记参考资料个人简介 摘自 http://www.infoq.com/cn/articles/hadoop-ten-years-interpretation-and-development-forecast 作者:陈飚 发表时间:2016...

  • 2015年,大数据将在企业里进一步推进,使用更多的用例(特别是实时用例),hadoop分布式专家mapr的联合创始人兼ceo john schroeder说。 schroeder说:“今年,机构将覆盖之前的初次批量实现,进行大数据实时部...

  •  第二款产品预计会在2015年下半年推出,这是一款利用container和docker来运行hadoop的现有版本,帮助企业简化hadoop的部署流程,有了这个方案以后,企业在部署hadoop机群的时候,再启动100个机群的时候可能只需要2...

  • hadoop的前世今生

  • 对于传入的longwritable...代码设计:重写map,reducer类,再写一个运行实现类。基于map reducer对数据进行分析实现下面的结果输出。方式二:打jar再hadoop上运行。方式一:本地导入数据,本地运行。上传数据到hadoop。

  • apache hadoop软件库是一个框架,允许使用简单的编程模型跨计算机集群分布式处理大型数据集。 它旨在从单个服务器扩展到数千台计算机,每台计算机都提供本地计算和存储。 库本身不是依靠硬件来提供高可用性,而是...

  • 感动于技术的日新月异时,希望通过这篇内容深入解读hadoop的昨天、今天和明天,憧憬下一个十年。 本文分为技术篇、产业篇、应用篇、展望篇四部分  技术篇    2006年项目成立的一开始,

  • 2015年6月9-11日,我在美国加州硅谷参加了第八届全球hadoop技术峰会(hadoop summit 2015)。在短短的3天时间里我既见识到了hortonwork、cloudera、sap、ibm、惠普、雅虎等25 数据服务技术提供商围绕大数据设计开发的...

  • 该项目使用 hadoop-mapreduce 对大约 3000 只纳斯达克股票进行了股票波动率计算。 该项目是作为纽约州立大学布法罗大学 vipin chaudhary 博士的 cse587-数据密集型计算(2015 年spring)课程的一部分实施的

  • hadoop基础介绍 云计算 云计算是对现有资源集中优化后,对客户提供服务,从现在的情况来看云计算真实的为大家提供了服务,比如:网盘等。至于云计算更为准确的定义为美国国家标准与技术研究院(nist)定义:云计算...

  • vb语言vb光盘管理系统设计(源代码 系统)本资源系百度网盘分享地址

  • h型脚架疲劳测试机sw16可编辑_零件图_机械工程图_机械三维3d建模图打包下载.zip

  • 笔记.zip

  • python库是一组预先编写的代码模块,旨在帮助开发者实现特定的编程任务,无需从零开始编写代码。这些库可以包括各种功能,如数学运算、文件操作、数据分析和网络编程等。python社区提供了大量的第三方库,如numpy、pandas和requests,极大地丰富了python的应用领域,从数据科学到web开发。python库的丰富性是python成为最受欢迎的编程语言之一的关键原因之一。这些库不仅为初学者提供了快速入门的途径,而且为经验丰富的开发者提供了强大的工具,以高效率、高质量地完成复杂任务。例如,matplotlib和seaborn库在数据可视化领域内非常受欢迎,它们提供了广泛的工具和技术,可以创建高度定制化的图表和图形,帮助数据科学家和分析师在数据探索和结果展示中更有效地传达信息。

  • python库是一组预先编写的代码模块,旨在帮助开发者实现特定的编程任务,无需从零开始编写代码。这些库可以包括各种功能,如数学运算、文件操作、数据分析和网络编程等。python社区提供了大量的第三方库,如numpy、pandas和requests,极大地丰富了python的应用领域,从数据科学到web开发。python库的丰富性是python成为最受欢迎的编程语言之一的关键原因之一。这些库不仅为初学者提供了快速入门的途径,而且为经验丰富的开发者提供了强大的工具,以高效率、高质量地完成复杂任务。例如,matplotlib和seaborn库在数据可视化领域内非常受欢迎,它们提供了广泛的工具和技术,可以创建高度定制化的图表和图形,帮助数据科学家和分析师在数据探索和结果展示中更有效地传达信息。

  • python库是一组预先编写的代码模块,旨在帮助开发者实现特定的编程任务,无需从零开始编写代码。这些库可以包括各种功能,如数学运算、文件操作、数据分析和网络编程等。python社区提供了大量的第三方库,如numpy、pandas和requests,极大地丰富了python的应用领域,从数据科学到web开发。python库的丰富性是python成为最受欢迎的编程语言之一的关键原因之一。这些库不仅为初学者提供了快速入门的途径,而且为经验丰富的开发者提供了强大的工具,以高效率、高质量地完成复杂任务。例如,matplotlib和seaborn库在数据可视化领域内非常受欢迎,它们提供了广泛的工具和技术,可以创建高度定制化的图表和图形,帮助数据科学家和分析师在数据探索和结果展示中更有效地传达信息。

  • 金属材料杂质自动检测设备sw17可编辑_零件图_机械工程图_机械三维3d建模图打包下载.zip

global site tag (gtag.js) - google analytics
网站地图