文档结构  
翻译进度:已翻译     翻译赏金:0 元 (?)    ¥ 我要打赏

George Hill ,他是知名商业媒体 Innovation Enterprise 的主编,同时也是 The Cyclist 公司的联合创始人。

长期以来,Hadoop 这个词铺天盖地,几乎成了大数据的代名词。三年之前,提起超越 Hadoop 这件事,似乎还显得难以想象。但三年后的今天,这一情况发生了一些改变。

早在 2012 年,知名媒体 SiliconANGLE 就针对 Twitter 平台上的大数据专业人士做了一项调查。调查结果显示:这些专业人士日常谈论 NoSQL 等技术(如 MongoDB)的次数要远多于 Hadoop。这表明,至少在数据科学家的群体中,用 Hadoop 代指大数据似乎并不准确。

第 1 段(可获 1.73 积分)

然而大多数人认为 Hadoop 已经是大数据最重要的技术之一,是大数据构建的基础。它还被利用在一些新的领域,如仓储系统。话虽如此,出人意料的是,它的适用性或多或少有点滞后。对此,IBM Software 的传道士 James Kobielus 说道:” 2016 年,Hadoop 在大数据领域的下滑速度比我预期的要快得多。“

其中原因很难说清,但可将其理解为数据领域的惯有现象。Gartner 于 2015 年的调查显示,54% 的公司都没有计划投资 Hadoop,另外 44% 的公司表示已使用 Hadoop 或将在未来两年使用。这些数据不同人看来有不同的观点,你可以认为 Hadoop 将进一步扩大,也可以认为大多数人根本不重视 Hadoop。同时,调查还揭露了一些其他无法平息的影响因素。在没有投资的人当中,49% 的人仍在努力挖掘 Hadoop 的使用价值,而另外 57% 的人指出,其中的技能差距是决定是否使用的主要阻碍,而这并不能立马得到解决。这一现象恰好与 ”Hadoop Testing“ 关于就业趋势的调查结果相一致:在 2014 年中旬,这一关键词在大约 0.061% 的广告中出现,在 2016 年末又增长至 0.087%,在 18 个月内,增长了约 43%。

第 2 段(可获 3.49 积分)

这可能表明,采用Hadoop的公司数量不一定会降低到坊间证据表明的那样,但公司只是发现很难从他们现有的团队中提取Hadoop的价值,他们需要更多的专业知识。

另一个可能引起人们关注的因素是,一个人的大数据却是另一个人的小数据。 Hadoop是为大量数据而设计的,Kashif Saiyed在KD Nuggets上写道:‘如果你的企业没有真正面临海量数据的问题,你就不需要Hadoop,因此数百家企业对他们无用的、处理2到10TB数据规模大小的 Hadoop集群感到非常失望 - Hadoop技术只是不擅长处理这种规模。‘

第 3 段(可获 1.53 积分)

大多数公司目前没有足够的数据来保证Hadoop的部署,但还是这么做的原因是他们觉得他们需要互相攀比。 经过几年的实验,并与真正的数据科学家一起工作,他们很快就意识到他们的数据在其他技术上工作得更好。

这种趋势已经超出了采用开源平台的速度,但对于一些公司来说,这已经产生了实际的财务影响。 Cloudera和Hortonworks是从Hadoop框架构建自己产品的两家最大的公司。 由于Hadoop的下滑,对于两家公司都造成了不同程度的重大损失,据报告Cloudera失去了40%,而Hortonworks的股价自2015年中期以来已经下跌了68%。

第 4 段(可获 1.54 积分)

这篇文章对Hadoop的批评似乎有些苛刻,但并不是平台本身造成了当前的问题。 相反,这可能是由于过分炒作和大数据协会导致了事实上的伤害。一些公司采用了该平台却没有理解它,同时又没有合适的人或数据来使其正常工作,这导致了项目实施的幻灭和明显的停滞。Hadoop依然还有强大的生命力,只是人们需要更好地理解它。 

第 5 段(可获 1.13 积分)

文章评论