要求:高吞吐量的批处理,及时响应
设计思想
- 使用了很多数据库的实现策略
- 不支持完整的关系数据类型
- 只有三层,保证了速度
- 没有严格的schema,用户自己定义schema
数据模型
- 访问依据:
- 索引=行关键字+列关键字+时间戳
- Map中的每个value(存储内容)都是一个未经解析的byte数组
- 索引=行关键字+列关键字+时间戳
(row: string, column: string,time: int64) -> string
- 行
- 列
- 访问控制单元的基本单位
- 存放在同一个列族下的所有数据通常都属于同一个类型
基本操作
- 单行数据处理
- 支持跨行写入,不支持通用的跨行事务处理
- 计算功能:可以合MapReduce一起使用