文武天下

CSDN弹窗广告无法忍受,本博客不再更新,迁到http://www.cnblogs.com/whuqin/

排序:
默认
按更新时间
按访问量

有意思的记录-python

1.变量 类变量紧接在类名后面定义,相当于java和c++的static变量 实例变量在init里定义,相当于java和c++的普通变量2.日期#coding:utf-8 import time import datetime #日期格式化,time.strftime(format[, t])...

2015-08-28 15:57:43

阅读数:547

评论数:0

有意思的记录-Java

1.文件读取 项目外的绝对路径或相对路径文件读取 String path = "/xx/xx.txt"; BufferedReader reader = new BufferedReader( new FileReader(new File(path)); 项目内(常常...

2015-08-07 17:05:44

阅读数:472

评论数:0

Linux常用系统查看命令(持续更新)

1.查看cpu个数 cat /proc/cpuinfo | grep processor | wc -l 2.查看任务及系统情况 top第一行是任务队列信息,等同于uptime命令;第二三行为进程和CPU信息;第四五行为内存信息。 补:load average-系统负载,就是任务队列的平均长...

2012-10-09 11:09:58

阅读数:1102

评论数:0

sh有意思的记录-shell(持续更新)

1.统计重复行的个数 如:uid.txt aaa bbb bbb aaa sort uid.txt | uniq -c得到 2 aaa  2 bbb  2.查看压缩文件 a.gz, b.gz, c.gz cat *.gz | gunzip > 123 3.查看2个文件的交集、差集 ...

2012-08-23 17:51:44

阅读数:1271

评论数:0

有意思的记录-C++(持续更新)

1.数组指针 void main() {   int a[5]={1,2,3,4,5};   int *ptr=(int *)(&a+1);   printf("%d,%d",*(a+1),*(ptr-1)); }输出结果为:2,5 &a是数组指针,...

2011-09-11 15:47:32

阅读数:805

评论数:0

Java动态编译

程序产生过程下图展示了从源代码到可运行程序的过程,正常情况下先编译(明文源码到字节码),后执行(JVM加载字节码,获得类模板,实例化,方法使用)。本文来探索下当程序已经开始执行,但在.class甚至.java还未就绪的情况下,程序如何获得指定的实现。这就是我们下面的主题,动态编译。 相关类介绍J...

2015-11-13 16:14:02

阅读数:2835

评论数:0

聊聊排名算法

很多网站或应用会提供各样的排行榜,如热门查询、热门应用、最佳文章、论坛评论/文章列表展示等。前段时间做游戏的搜索热词就看了几篇文章,总结记录下。先介绍下流传比较广的算法,再说下我的算法。

2015-11-06 11:42:45

阅读数:1002

评论数:0

Lucene系列-FieldCache

域缓存,加载所有文档中某个特定域的值到内存,便于随机存取该域值。用途及使用场景当用户需要访问各文档中某个域的值时,IndexSearcher.doc(docId)获得Document的所有域值,但访问速度比较慢,而且只能获得Stored域的值。 FieldCache能获得域值数组,根据docId...

2015-10-09 17:46:54

阅读数:1877

评论数:1

Redis系列-好玩的用法

分布式锁客户端执行如下命令,来获取锁和释放锁。random = random() ok = (Set key random PX 2000ms NX) if (ok) { //do something if (redis->get(key) == random) { ...

2015-09-18 19:51:14

阅读数:779

评论数:0

Maven常用插件

maven利用各种插件来管理构建项目,本文记录下工作中常用到的插件及使用方法。常用插件见:http://maven.apache.org/plugins/index.html,http://www.mojohaus.org/plugins.html。 每个插件都会提供多个目标(goal),用于标...

2015-09-10 17:12:47

阅读数:1380

评论数:0

Hadoop相关日常操作

1.Hive相关 脚本导数据,并设置运行队列 bin/beeline -u 'url' --outputformat=tsv -e "set mapreduce.job.queuename=queue_1" -e "select * from search_log...

2015-08-28 16:37:20

阅读数:450

评论数:0

Spark使用实例

1.介绍 Spark是基于Hadoop的大数据处理框架,相比较MapReduce,Spark对数据的处理是在本地内存中进行,中间数据不需要落地,因此速度有很大的提升。而MapReduce在map阶段和Reduce阶段后都需要文件落地,对于连续的数据处理,就需要写多个MapReduce Job接力...

2015-08-28 15:04:59

阅读数:1719

评论数:0

阿里巴巴B2B搜索学习

1.搜索业务 主搜索:商品搜索、商家搜索、采购搜索、app搜索 行业搜索:淘货源、淘工厂、聚好货、主题市场、品牌馆等 2.优势 由于用户多,需求强烈,收益大,所以功能、场景、架构做到极致高效。 代码复用性强:基础通用功能进行组件抽象化组件通用性好:一些组件或者组件进行组合的服务,...

2015-07-31 14:26:09

阅读数:990

评论数:0

海量数据搜索的思考

后续完善。背景miui有1亿用户(108),每个用户有1万张相片(104)。从数据量和数据大小两个方面认识下。 数据量:共有1012条数据,100台机子存储,每台机子1010条数据(100亿)。 数据大小:每个用户的数据占2MB,共2*108MB = 200TB,200台机子存储,每台机子存储1T...

2015-06-24 16:37:20

阅读数:730

评论数:0

Linux网络编程系列-TCP传输控制

滑动窗口(sliding window)滑动窗口是用于流量控制的,发送端根据接收端的处理能力发送数据,不至于造成过多的丢包。 在TCP头中有一个字段window,这个字段就是接收端告诉发送端自己还有多少缓冲区可以接收数据。发送端根据这个字段的值来发送数据,当值为0时就停止发送。 发送端和接收端...

2015-05-22 20:33:27

阅读数:657

评论数:0

Lucene系列-索引文件

本文介绍下lucene生成的索引有哪些文件组成,每个文件包含了什么信息。基于Lucene 4.10.0。数据结构索引(index)包含了存储的文档(document)正排、倒排信息,用于文本搜索。索引又分为多个段(segments),每个新添加的doc都会存到一个新segment中,不同的segm...

2015-04-24 19:08:39

阅读数:1662

评论数:0

python Web开发框架-Django (2)

接上篇文章,介绍一些实用的技巧和注意点。包括GET/POST,前端使用和参考资料

2015-03-25 11:21:47

阅读数:2340

评论数:0

python Web开发框架-Django (1)

以前用web.py(另外一款轻量级web开发框架)做一个监控管理平台,没有做特别的记录就不好拾起来。最近做一个日志聚合系统,使用的是django,这次就记下来,方便查询。 Django是一个高效的web开发框架,上手容易,便于调试和发布。 设计模式 它的设计遵循经典的web设计架构-MVC(Mod...

2015-03-24 16:36:34

阅读数:1293

评论数:0

Java垃圾回收-分代收集

Java自动垃圾回收(Automatic Garbage Collection)是自动回收堆上不再使用的内存,new的对象在程序中没有引用指向它,就不会被回收。回收的实现很多,有Reference Counting Collector/Tracing Collector/Compacting Co...

2015-02-15 19:15:06

阅读数:2457

评论数:0

Lucene系列-近实时搜索(1)

近实时搜索(near-real-time)可以搜索IndexWriter还未commit的内容,介于immediate和eventual之间,在数据比较大、更新较频繁的情况下使用。lucene的nrt可以控制更新生效的间隔时间。 基本过程: 打开indexwriter从indexwriter中...

2015-01-20 20:01:33

阅读数:2914

评论数:1

提示
确定要删除当前文章?
取消 删除
关闭
关闭