整套大数据学习资料(视频+笔记)百度网盘无门槛下载:http://www.edu360.cn/news/content?id=3377

16.1.5总结

hadoop 花牛 12℃ 0评论

Hadoop已经成为Last.fm基础框架的一个重要部件,它用于产生和处理各种各样的数据集,如网页日志信息和用户收听数据。为了让大家能够掌握主要的概念,这里讲述的例子已经被大大地简化;在实际应用中输入数据具有更复杂的结构并且数据处理的代码也更加繁琐。虽然Hadoop本身已经足够成熟可以支持实际应用,但大家仍在积极地开发Hadoop,每周Hadoop 社区都会为它增加新的特性并提升它的性能。Last.fm作为代码和新想法的

贡献者很高兴是这个社区的一份子,同时也是对大量开源技术进行利用的终端用户。

16.2Hadoop 和 Hive 在 Facebook 的应用

Hadoop可以用于构建核心的后台批处理以及近似实时计算的基础架构。它也可用于保存和存档大规模数据集。在下面这个实例中,我们将主要考察后台的数据架构以及Hadoop在其中充当的角色。我们将在假想的Hadoop 配置下描述具有潜力的Hive系统(Hive是建立于Hadoop之上的数据仓库和 SQL体系结构的开源代码)和使用该体系架构构建的各种各样的商业及产品应用。

转载请注明:全栈大数据 » 16.1.5总结

喜欢 (0)or分享 (0)
发表我的评论
取消评论

表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址