利用dbHash恢复不一致的mongodb config server

博客分类：

mongodb

原来mongodb的文档上一直宣称是2阶段协议提交来保证3个config server保持强一致性,然而其实不是的 https://jira.mongodb.org/browse/DOCS-5289 有人看源代码,发现mongodb源码和文档不一致,提交了这个jira,导致mongodb连官方文档都改了...噗... 由于各种原因导致config server不一致的时候,mongos日志中出现了 will not perform auto-split because config servers are inconsistent 可以用dbHash来比较3个config server,找到不 ...

2016-07-14 20:03
浏览 811
评论(0)
分类:开源软件

利用expect自动建立无密钥登录

博客分类：

linux

expect linux

建立无密钥登录最好用ssh-copy-id 但是它有个问题是每次都无脑的在authorized_keys文件中添加数据,容易造成重复,而且如果有很多台服务器要建立的话要运行多次,多次输入"yes",多次输入密码. 利用expect可以实现自动安装 https://github.com/kabike/autoSSHKey

2016-07-05 18:25
浏览 436
评论(0)
分类:操作系统

linux expect的f选项

博客分类：

linux

linux 脚本

expect脚本的开头一般都写/usr/bin/expect -f,这个-f选项有什么作用呢? 比如如下脚本 #!/usr/bin/expect -f for {set i 0} {$i < $argc} {incr i} { puts "arg $i: [lindex $argv $i]" } 运行./bar.sh -c "puts foo" hehe bar输出如下引用foo arg 0: hehe arg 1: bar 如果改成#!/usr/bin/expect,则输出如下引用arg 0: -c arg 1: puts fo ...

2016-07-04 18:54
浏览 2259
评论(0)
分类:操作系统

记录一些linux命令

博客分类：

linux

linux

1 查询某个yum源安装了哪些包 yum install yum-utils yumdb search from_repo bar 2 查看哪些包依赖krb5-libs repoquery --whatrequires krb5-libs 3 利用xargs -n 1,解压多个tar文件 echo *.tgz | xargs -n 1 tar xf 4 利用tee和exec,将一个脚本中所有的输出额外添加到文件中 exec &> >(tee -a "bar.log") echo "This will be logged to the fil ...

2016-05-06 17:54
浏览 584
评论(0)
分类:操作系统

mongodb shell中显示更多数量的结果

博客分类：

大数据

mongodb

DBQuery.shellBatchSize = 300 http://stackoverflow.com/questions/3705517/how-to-print-out-more-than-20-items-documents-in-mongodbs-shell

2015-11-10 17:38
浏览 1664
评论(0)
分类:数据库

zookeeper的log4j配置真是失败的典范

博客分类：

杂谈
大数据

各种地方都能配置zookeeper的log4j,真是太烦人了.给用户太多的选择,并不一定能更好的提升用户体验

2015-08-28 18:23
浏览 1108
评论(0)
分类:非技术

linux时间同步

博客分类：

linux

我一直以为要用cron job和ntpdate,现在发现应该用ntpd. http://www.ansen.org/2014/01/linuxntpdntpdate_21.html

2015-08-28 17:47
浏览 343
评论(0)
分类:操作系统

clojure中的agent实现

博客分类：

tools

最近看了下clojure的并发,其中提到了agent.agent的原理是把对agent的action提交到线程池中运行.它保证线程安全的措施是对每一个agent,同时只有一个actio 在运行. 下面做一个简单的对比,多个线程多次对同一个StringBuilder进行append,如果不同步,结果是不正确的. final StringBuilder sb = new StringBuilder(); ExecutorService pool = Executors.newFixedThreadPool(Runtime .getRuntime().availableProce ...

2015-07-30 18:15
浏览 825
评论(0)
分类:编程语言

storm中添加自定义metrics

博客分类：

大数据
storm

storm中有时需要添加一些metrics监控项,这时需要添加metrics. 在spout或者bolt的prepare方法中注册metrics public void prepare(@SuppressWarnings("rawtypes") Map stormConf, TopologyContext context, OutputCollector collector) { this.collector = collector; barMetric = new CountMetric(); context.registerMetric(&qu ...

2015-07-30 18:13
浏览 1962
评论(0)
分类:开源软件

storm实现迷你批量提交

博客分类：

大数据
storm

storm中有种应用场景,是迷你批量,比如积攒一定数量的tuple,超过一定时间或者数量之后,把这些tuple统一处理. 想到了以下三种思路 1 在bolt中额外启动一个线程.不过在bolt中启动线程就要考虑并发的问题 2 定义另一个command stream,根据需要向这个command stream发tuple.bolt根据tuple的sourceStreamId判断是正常的stream 还是command stream. 这样需要在建立拓扑时有一些额外操作,比如为command stream建立一个spout,每个bolt用allGrouping从command stream的spout ...

2015-07-30 18:12
浏览 683
评论(0)
分类:开源软件

java中获得hostname的方式

博客分类：

linux

最近用storm的过程中发现了一个问题,根源也是hostname获取的不正确.和http://kabike.iteye.com/blog/2111791问题类似 storm,hadoop这些java项目在linux上取得hostname的时候,不是简单调用hostname这个命令,而是调用 InetAddress.getLocalHost().getCanonicalHostName() 显而易见,如果/etc/hosts把hostname设置成127.0.0.1这个回环IP,就很有可能把hostname取成localhost

2015-07-30 18:10
浏览 2248
评论(0)
分类:操作系统

java的内存counter

博客分类：

基础

假设需要在内存中维护一个计数器,在storm tuple来时更新计数器的值,最终统一提交到数据库可以用commons-collection中的Bag或者MultiValueMap,不过效率不高. 用java的Map放Integer主要问题在于Integer是不可变类,每次需要构造新的对象,开销比较大,因此尝试了common-lang中的MutableInt和java.util中的AtomicInteger,这俩的效率不相上下. 不过最快的方式是在Map中放int数组...不过优势也不是特别明显 int size = 10000000; // 1 long ...

2015-07-16 18:49
浏览 999
评论(0)
分类:编程语言

hadoop用Quorum Journal Manager(QJM)实现高可用

博客分类：

大数据
hadoop

官方文档写的还行.补充几点 1 如果没有自动failover,两个namenode启动后都是standby状态文档上说用 "hdfs haadmin -failover"命令使其中一个active. hdfs haadmin -failover命令正确用法是引用hdfs haadmin -failover node13 node14 2 如果hbase想使用hdfs的ha,需要把hdfs的core-site.xml hdfs-site.xml加入classpath.比如在hbase的conf建立这两个文件的链接,或者在hbase-env.sh加到classpath

2015-07-04 17:03
浏览 769
评论(0)
分类:开源软件

忍不住想喷hadoop的文档

博客分类：

大数据
hadoop

就说hdfs的checkpoint node吧,它说引用Multiple checkpoint nodes may be specified in the cluster configuration file. 哥,你敢具体写么?你这东西各种bug你知道么? https://issues.apache.org/jira/browse/HDFS-7871 2.7才fix,之前是不是根本没人用

2015-07-03 23:27
浏览 544
评论(0)
分类:开源软件

忍不住要喷一下kafka

博客分类：

MQ
大数据

https://issues.apache.org/jira/browse/KAFKA-369 使用consumer的时候要指定zookeeper,使用producer要指定broker.一个集群两种配置,很容易出错.用户体验不好,差评而且kafka的文档也相当糟糕了...simple consumer根本就没有group的概念,0.8.2以后的java producer也挺模糊. 唉

2015-06-17 16:12
浏览 328
评论(0)
分类:开源软件

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

利用dbHash恢复不一致的mongodb config server

利用expect自动建立无密钥登录

linux expect的f选项

记录一些linux命令

mongodb shell中显示更多数量的结果

zookeeper的log4j配置真是失败的典范

linux时间同步

clojure中的agent实现

storm中添加自定义metrics

storm实现迷你批量提交

java中获得hostname的方式

java的内存counter

hadoop用Quorum Journal Manager(QJM)实现高可用

忍不住想喷hadoop的文档

忍不住要喷一下kafka

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

最近访客更多访客>>