原文来源于网络,转载自大数据人(ID:bigdata_ren),如涉及侵权,请联系后台删除。
摘要:说到处理大数据的工具,普通的开源解决方案(尤其是ApacheHadoop)堪称中流砥柱。
弗雷斯特调研公司的分析师MikeGualtieri最近预测,在接下来几年,“%的大公司”会采用Hadoop。MarketResearch的一份报告预测,到年,Hadoop市场会以58%的年复合增长率(CAGR)高速增长;到年,市场产值会超过10亿美元。
IBM更是非常看好开源大数据工具,派出了名研究人员开发ApacheSpark,这个工具是Hadoop生态系统的一部分。
这回我们推出了最新的顶级开源大数据工具排行榜。这个领域最近方兴未艾,许多新项目纷纷启动。许多最知名的项目由Apache基金会管理,与Hadoop密切相关。
请注意:本文不是要搞什么排名;相反,项目按类别加以介绍。与往常一样,要是你知道另外的开源大数据及/或Hadoop工具应该榜上有名,欢迎留言交流。
一、Hadoop相关工具
1.Hadoop
Apache的Hadoop项目已几乎与大数据划上了等号。它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算。
支持的操作系统:Windows、Linux和OSX。