hbase中的BloomFilter起作用的场景 - 大神带我来搬砖 - ITeye博客

`

kabike

浏览: 597998 次
性别:
来自: 大连

最近访客更多访客>>

agreetech

confused9090

kavy

aininim

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

fei33423：同意你的说法. hbase 的强一致性分为两部分来说. 数据分 ...
浅谈Hbase 的强一致性
zengwenbo5566： ,高人，刚安装了 genymotion 那个附带 virtu ...
VirtualBox报错Unable to load R3 module GetLastError=1790 (VERR_UNRESOLVED_ERROR
kabike： QQ1289714862 写道这代码有问题吧 bar1 bar ...
AtomicBoolean运用
QQ1289714862：这代码有问题吧 bar1 bar2 那来的你是不是new了两 ...
AtomicBoolean运用
DEMONU：需要依赖这么多东西啊
hbase 0.96和hadoop 2.2 java 客户端的jar依赖

hbase中的BloomFilter起作用的场景

博客分类：

hbase
大数据

阅读更多

hbase中有BloomFilter的功能,可以在有些情况下过滤掉不需要的hfile,节省IO.但是BloomFilter在什么情况下起作用呢?根据hbase文档,只有get操作才使用到BloomFilter

引用

In terms of HBase, Bloom filters provide a lightweight in-memory structure to reduce the number of disk reads for a given Get operation (Bloom filters do not work with Scans) to only the StoreFiles likely to contain the desired Row. The potential performance gain increases with the number of parallel reads.

从代码上来看
StoreFileScanner的shouldUseScanner方法中,测试这个storefile是否应该被读取

 public boolean shouldUseScanner(Scan scan, SortedSet<byte[]> columns, long oldestUnexpiredTS) {
    return reader.passesTimerangeFilter(scan, oldestUnexpiredTS)
        && reader.passesKeyRangeFilter(scan) && reader.passesBloomFilter(scan, columns);
  }

passesBloomFilter方法中,一开始就pass了get以外的操作

  if (!scan.isGetScan()) {
        return true;
      }

所以passesBloomFilter只对get起作用,scan是不起作用的

[url] http://www.quora.com/How-are-bloom-filters-used-in-HBase[/url]
里提到如果集中的批量的对一个row进行put,那么这个row分布在少量的Hfile中,如果均匀的在不同column上进行put,就可能导致一个row的不同keyvalue分布在所有Hfile中,那么row 级别的bloom filter就不起作用了.

0
顶

1
踩

分享到：

Opentsdb的技术特点 | Infobright查看知识网格状态

2014-12-09 18:57
浏览 2324
评论(0)
分类:开源软件
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

HBase中Coprocessor的介绍以及实际业务场景中的使用.pdf: 讲师：陈杨——快手大数据高级研发工程师 ...内容概要：(1)讲解hbase coprocessor的原理以及使用场景，(2) coprocessor整个流程实战，包括开发，加载，运行以及管理(3)结合1，2分析coprocessor在rsgroup中的具体使用

HBASE基本概念以及使用场景: 根据个人的经验，总结出来的HBASE基本概念以及使用场景，原本用于内部分享

java大数据作业_3HBase: 2. 请简述HBase中数据写入最后导致Region分裂的全过程 3. 如果设计一个笔记的表，表中要求有笔记的属性和笔记的内容，怎么做 4. HBase部署时如何指定多个zookeeper 5. HBase shell是基于哪种JVM运行的语言实现的 6. ...

Hbase中文文档: 2.9. Bloom Filter 3. 升级 3.1. 从HBase 0.20.x or 0.89.x 升级到 HBase 0.90.x 3.2. 从 0.90.x 到 0.92.x 4. The HBase Shell 4.1. 使用脚本 4.2. Shell 技巧 5. 数据模型 5.1. 概念视图 5.2. 物理视图 5.3. 表 ...

藏经阁-Hbase 在滴滴出行的应用场景及最佳实践.pdf: 藏经阁-Hbase 在滴滴出行的应用场景及最佳实践.pdf

hbase中文官方文档: hbase中文官方文档，非常不错，值得推荐

java操作Hbase之从Hbase中读取数据写入hdfs中源码: java操作Hbase之从Hbase中读取数据写入hdfs中源码，附带全部所需jar包，欢迎下载学习。

Hbase 官方中文文档: Hbase中文文档。想0分分享，结果不能设置0分了；坑爹了。

Python-HBase中文参考指南: HBase 中文参考指南

HBase 0.97 中文文档: HBase 0.97 中文文档 HBase 0.97 中文文档 HBase 0.97 中文文档

HbaseTemplate 操作hbase: java 利用 sping-data-hadoop HbaseTemplate 操作hbase find get execute 等方法可以直接运行

企业中应用HBase: 企业中应用HBase

Hbase笔记 —— 利用JavaAPI的方式操作Hbase数据库（往hbase的表中批量插入数据）.pdf: Hbase笔记 —— 利用JavaAPI的方式操作Hbase数据库（往hbase的表中批量插入数据）

pinpoint的hbase初始化脚本hbase-create.hbase: 搭建pinpoint需要的hbase初始化脚本hbase-create.hbase

HBase中文教程 PDF 下载: HBase中文教程

hbase中文文档: 这是 Apache HBase的官方文档, Hbase是一个分布式,版本化(versioned)，构建在 Apache Hadoop和 Apache ZooKeeper上的列数据库.专业人士翻译

大数据HBase的使用场景: HBase不能取代RDBMS，因为二者的应用场景不同。HBase为了解决海量数据的扩展性，支持简单的增加节点来实现线性扩展，从而在集群上管理海量的非结构化或半结构化的稀疏数据。HBase仅能通过主键（row key）或主键的...

HBase实战%28中文扫描版%29.pdf: HBase

Global site tag (gtag.js) - Google Analytics