整套大数据学习资料(视频+笔记)百度网盘无门槛下载:http://www.edu360.cn/news/content?id=3377

13.7.4 模式的设计

hadoop 花牛 9℃ 0评论

单元格是有版本的;数据行是有序的,只要列族存在,列便可以由客户端 随时添加;除了这三个特性以外HBase的表和RDBMS中的表是类似的。

虽然在为HBase设计模式时,需要考虑这呰不同点,但最重要的是要考虑 数据的访问方式。所有的数据都是通过主键进行访问的,所以在设计时, 最主要的问题是知道如何査询这些数据。在对HBase这样的面向列(族)的 存储设计模式时,另一件需要记住的是它可以以极小的开销管理较宽的稀疏表。

1.连接

HBase并没有内置对数据库连接的支持。但是“宽表”(wide table)使我们并 不需要让第一个表和第二个表或第三个表进行数据库连接。一个宽行有时 可以容下一个主键相关的所有数据。

2. 行键

应该把较多的精力用于设计行的键。在本章的气象数据示例中,复合的行键利用观测站作为前缀,对同一个观测站的气温数据进行分组。反向时间戳后缀使我们可以扫描以及按时间序读到从最近到最远的气温数据。一个 精心设计的复合键可以用来对数据进行聚类,以配合数据的访问方式。

设计复合键时,可能需要用0来填充数据,使行键可以正确排序。否则,会碰到由于只考虑字节序而导致10排在2之前的情况(02排在10之前)。

如果键是整数,则应该使用二进制形式,而不是把数字持久化成字符串类型,字符串会占用更多的空间。

转载请注明:全栈大数据 » 13.7.4 模式的设计

喜欢 (0)or分享 (0)
发表我的评论
取消评论

表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址