整套大数据学习资料(视频+笔记)百度网盘无门槛下载:http://www.edu360.cn/news/content?id=3377

1.3. 相较于其他系统的优势

hadoop 花牛 9℃ 0评论

MapReduce看似采用了一种蛮力方法。每个査询需要处理整个数据集或至少一个数据集的绝大部分。但反过来想,这也正是它的能力。MapReduce是一个批量査询处理器,能够在合理的时间范围内处理针对整个数据集的动态查询。它改变了我们对数据的传统看法,解放了以前只是保存在磁带和硬盘上的数据。它让我们有机会对数据进行创新。以前需要很长时间处理才能获得结果的问题,到现在变得顷刻之间就迎刃而解,同时还可以引发新的问题和新的见解。

例如,Rackspace公司的邮件部门Mailtrust就用Hadoop来处理邮件日志。 他们写动态查询,想借此找出用户的地理分布。他们是这么描述的:“这些数据非常有用,我们每月运行一次MapReduce任务来帮助我们决定哪些 Rackspace数据中心需要添加新的邮件服务器。”

通过整合好几百GB的数据,用MapReduce来分析这些数据,Rackspace的 工程师从中发现了以前从来没有注意到的数据,甚至还运用这些信息来改善了现有的服务。

转载请注明:全栈大数据 » 1.3. 相较于其他系统的优势

喜欢 (0)or分享 (0)
发表我的评论
取消评论

表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址