整套大数据学习资料(视频+笔记)百度网盘无门槛下载:http://www.edu360.cn/news/content?id=3377

13.6.2 HBase

hadoop 花牛 19℃ 0评论

让我们考虑HBase,它具有以下特性。

•没有真正的索引行是顺序存储的,每行中的列也是,所以不存在 索引膨胀的问题,而且插入性能和表的大小无关。

•自动分区在表增长的时候,表会自动分裂成区域,并分布到可用 的节点上。

•线性扩展和对于新节点的自动处理增加一个节点,把它指向现有 集群并运行regionserver。区域自动重新进行平衡,负载均匀分布。

•普通商用硬件支持集群可以用1000~5000美金的单个节点搭 建,而不需要使用单个得花5万美金的节点。RDBMS需要支持大量I/O,因此要求更昂贵的硬件。

•容错大量节点意味着每个节点的重要性并不突出。不用担心单个节点失效。

•批处理MapReduce集成功能使我们可以用全并行的分布式作业根据“数据的位置”(location awareness)来处理它们。

如果你没日没夜地担心数据库(正常运行时间、扩展性问题、速度),应该好 好考虑从RDBMS转向使用HBase。你应该使用一个针对扩展性问题的解决 方案,而不是性能越来越差却需要大量投入的曾经可用的方案。有了 HBase,软件是免费的,硬件是廉价的,而分布式处理则是与生俱来的。

转载请注明:全栈大数据 » 13.6.2 HBase

喜欢 (0)or分享 (0)
发表我的评论
取消评论

表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址