自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

文武天下

CSDN弹窗广告无法忍受,本博客不再更新,迁到http://www.cnblogs.com/whuqin/

  • 博客(204)
  • 资源 (48)
  • 收藏
  • 关注

原创 有意思的记录-python

1.变量 类变量紧接在类名后面定义,相当于java和c++的static变量 实例变量在init里定义,相当于java和c++的普通变量2.日期#coding:utf-8import timeimport datetime#日期格式化,time.strftime(format[, t]),#输出:2015-08-28 15:50:51currentTime = time.strftim

2015-08-28 15:57:43 720

原创 有意思的记录-Java

1.文件读取项目外的绝对路径或相对路径文件读取String path = "/xx/xx.txt";BufferedReader reader = new BufferedReader( new FileReader(new File(path));项目内(常常是resources目录下)或jar包内文件读取InputStream file = this.getClass

2015-08-07 17:05:44 613

原创 Linux常用系统查看命令(持续更新)

1.查看cpu个数cat /proc/cpuinfo | grep processor | wc -l2.查看任务及系统情况top第一行是任务队列信息,等同于uptime命令;第二三行为进程和CPU信息;第四五行为内存信息。补:load average-系统负载,就是任务队列的平均长度,分别是1分钟、5分钟、15分钟内的平均值。load average小于CPU个数,属

2012-10-09 11:09:58 1246

原创 sh有意思的记录-shell(持续更新)

1.统计重复行的个数如:uid.txtaaabbbbbbaaa sort uid.txt | uniq -c得到2 aaa 2 bbb 2.查看压缩文件a.gz, b.gz, c.gzcat *.gz | gunzip > 1233.查看2个文件的交集、差集comm 显示3列,第一列为1.txt独有的元素(1.txt-2.txt)

2012-08-23 17:51:44 1400

原创 有意思的记录-C++(持续更新)

1.数组指针void main(){  int a[5]={1,2,3,4,5};  int *ptr=(int *)(&a+1);  printf("%d,%d",*(a+1),*(ptr-1));}输出结果为:2,5&a是数组指针,其类型为 int (*)[5];而指针加1要根据指针类型加上一定的值,不同类型的指针+1之后增加的大小不同。&a是长度为5的int

2011-09-11 15:47:32 917

原创 Java动态编译

程序产生过程下图展示了从源代码到可运行程序的过程,正常情况下先编译(明文源码到字节码),后执行(JVM加载字节码,获得类模板,实例化,方法使用)。本文来探索下当程序已经开始执行,但在.class甚至.java还未就绪的情况下,程序如何获得指定的实现。这就是我们下面的主题,动态编译。 相关类介绍JavaCompiler: 负责读取源代码,编译诊断,输出class JavaFileObject: 文

2015-11-13 16:14:02 4386 1

原创 聊聊排名算法

很多网站或应用会提供各样的排行榜,如热门查询、热门应用、最佳文章、论坛评论/文章列表展示等。前段时间做游戏的搜索热词就看了几篇文章,总结记录下。先介绍下流传比较广的算法,再说下我的算法。

2015-11-06 11:42:45 1981

原创 Lucene系列-FieldCache

域缓存,加载所有文档中某个特定域的值到内存,便于随机存取该域值。用途及使用场景当用户需要访问各文档中某个域的值时,IndexSearcher.doc(docId)获得Document的所有域值,但访问速度比较慢,而且只能获得Stored域的值。 FieldCache能获得域值数组,根据docId random access域值。FieldCache是高级内部API,通常用户不会直接使用,Lucen

2015-10-09 17:46:54 2543 1

原创 Redis系列-好玩的用法

分布式锁客户端执行如下命令,来获取锁和释放锁。random = random()ok = (Set key random PX 2000ms NX)if (ok) { //do something if (redis->get(key) == random) { (del key) }}key不存在时设置,过期时间是2000ms。如果命令成功,表示获取锁

2015-09-18 19:51:14 986

原创 Maven常用插件

maven利用各种插件来管理构建项目,本文记录下工作中常用到的插件及使用方法。常用插件见:http://maven.apache.org/plugins/index.html,http://www.mojohaus.org/plugins.html。 每个插件都会提供多个目标(goal),用于标示任务。各插件配置在pom.xml里,如下:<build> [...] <plugins>

2015-09-10 17:12:47 1955

原创 Hadoop相关日常操作

1.Hive相关脚本导数据,并设置运行队列bin/beeline -u 'url' --outputformat=tsv -e "set mapreduce.job.queuename=queue_1" -e "select * from search_log where date = 20150523" > test.txt2.Spark相关spark任务提交$SPA

2015-08-28 16:37:20 621

原创 Spark使用实例

1.介绍Spark是基于Hadoop的大数据处理框架,相比较MapReduce,Spark对数据的处理是在本地内存中进行,中间数据不需要落地,因此速度有很大的提升。而MapReduce在map阶段和Reduce阶段后都需要文件落地,对于连续的数据处理,就需要写多个MapReduce Job接力执行。最近分析用户查询日志提取共现查询,流程如下:a.先获得对;b.合并同一个uid的querie

2015-08-28 15:04:59 2490

原创 阿里巴巴B2B搜索学习

1.搜索业务主搜索:商品搜索、商家搜索、采购搜索、app搜索行业搜索:淘货源、淘工厂、聚好货、主题市场、品牌馆等2.优势由于用户多,需求强烈,收益大,所以功能、场景、架构做到极致高效。代码复用性强:基础通用功能进行组件抽象化组件通用性好:一些组件或者组件进行组合的服务,适用更多场景,支持更多功能转化效果好:算法做的比较深入、细致3.搜索技术架构架构分为三部分

2015-07-31 14:26:09 1312

原创 海量数据搜索的思考

后续完善。背景miui有1亿用户(108),每个用户有1万张相片(104)。从数据量和数据大小两个方面认识下。数据量:共有1012条数据,100台机子存储,每台机子1010条数据(100亿)。数据大小:每个用户的数据占2MB,共2*108MB = 200TB,200台机子存储,每台机子存储1TB。初步印象集群需要机器数量以百衡量;从海量数据中查询想要的结果需要架构分层、数据分治;海量数据的管理

2015-06-24 16:37:20 887

原创 Linux网络编程系列-TCP传输控制

滑动窗口(sliding window)滑动窗口是用于流量控制的,发送端根据接收端的处理能力发送数据,不至于造成过多的丢包。 在TCP头中有一个字段window,这个字段就是接收端告诉发送端自己还有多少缓冲区可以接收数据。发送端根据这个字段的值来发送数据,当值为0时就停止发送。 发送端和接收端各自维护着一个窗口,发送的滑动窗口控制可以发送的数据大小,接收端的窗口控制可以接收数据的大小。 发

2015-05-22 20:33:27 814

原创 Lucene系列-索引文件

本文介绍下lucene生成的索引有哪些文件组成,每个文件包含了什么信息。基于Lucene 4.10.0。数据结构索引(index)包含了存储的文档(document)正排、倒排信息,用于文本搜索。索引又分为多个段(segments),每个新添加的doc都会存到一个新segment中,不同的segments又会合并成一个segment。segment存储着具体的documents,每个doc有一系列的

2015-04-24 19:08:39 2130

原创 python Web开发框架-Django (2)

接上篇文章,介绍一些实用的技巧和注意点。包括GET/POST,前端使用和参考资料

2015-03-25 11:21:47 2622

原创 python Web开发框架-Django (1)

以前用web.py(另外一款轻量级web开发框架)做一个监控管理平台,没有做特别的记录就不好拾起来。最近做一个日志聚合系统,使用的是django,这次就记下来,方便查询。Django是一个高效的web开发框架,上手容易,便于调试和发布。设计模式它的设计遵循经典的web设计架构-MVC(Model-view-controller),一个应用分为四部分:models.py:文件

2015-03-24 16:36:34 1557

原创 Java垃圾回收-分代收集

Java自动垃圾回收(Automatic Garbage Collection)是自动回收堆上不再使用的内存,new的对象在程序中没有引用指向它,就不会被回收。回收的实现很多,有Reference Counting Collector/Tracing Collector/Compacting Collector/Coping Collector/Generational Collector/Ada

2015-02-15 19:15:06 3173

原创 Lucene系列-近实时搜索(1)

近实时搜索(near-real-time)可以搜索IndexWriter还未commit的内容,介于immediate和eventual之间,在数据比较大、更新较频繁的情况下使用。lucene的nrt可以控制更新生效的间隔时间。基本过程:打开indexwriter从indexwriter中获得indexreader建立indexsearcher查看是否有变化,有变化则建立新read

2015-01-20 20:01:33 3756 1

原创 Lucene系列-facet

1.facet的直观认识facet:面、切面、方面。个人理解就是维度,在满足query的前提下,观察结果在各维度上的分布。如jd上搜“手机”,得到4009个商品。其中品牌、网络、价格就是商品的维度(facet),点击某个品牌或者网络,获取更细分的结果。点击品牌小米,获得小米手机的结果,显示27个。点击移动4G,获得移动4G、小米手机,显示4个。2.fac

2015-01-09 15:42:53 6161

原创 消息队列-rabbitMQ

消息队列两个用处:服务间解耦,缓解压力(削峰平谷),以前用过ZMQ、狼厂内部的NMQ,现在接触了java开源的kafka和RabbitMQ。目前先不求甚解,有个大概的认识。RabbitMQ的安装和入门例子见http://www.rabbitmq.com/,挺全的。安装前需要安装erlang,启动方便。RabbitMQ是一个强壮的消息队列,安装使用都很容易,支持常用的发布/订阅、消息分发功能

2014-12-18 21:05:34 1855

原创 redis源码系列-数据结构(adlist/ziplist/dict)

该系列基于redis-2.8.18,主要记录自己的理解或者想法。redis以自己支持存储的数据结构丰富吸引了大批人,把memcached比了下去。本文就从简单基本的数据结构入手。双向链表(adlist.h)typedef struct listNode { struct listNode *prev; struct listNode *next; void *val

2014-12-12 16:06:09 891

原创 Linux网络编程系列-常见疑惑

1.并发TCP最大连接数一个TCP连接you

2014-11-20 14:49:39 793

原创 消息队列-Kafka学习

Kafka是一个分布式的消息队列

2014-11-19 20:52:29 5116

原创 Lucene系列-搜索

Lucene搜索的时候就要构造查询语句,本

2014-10-24 19:59:15 923

原创 Lucene系列-分析器

搜索的基础是对文本信息进行分析,Lucene的分析工具在org.apache.lucene.analysis包中。

2014-10-23 16:48:17 1050

原创 Lucene系列-概述

为了生存,就得干一行爱一行。那就学习下luceneb

2014-10-11 14:55:56 855

原创 zk系列-zookeeper的使用

zk支持java/c访问,java常用的有apache-zkclient,以及社区版的i0tec-zkclient,i0

2014-09-26 16:57:43 4825

原创 zk系列-zookeeper概述

接触zk是2年前了,最近工作又比较依赖于zk,所以准备起个系列文章,系统的总结下。zook

2014-09-26 15:20:13 4536

原创 设计模式-行为模式(读书笔记)

行为模式涉及到算法和对象间职责的分配,行为模式不仅描述对象或类的模式,还描述它们之间的通信模式。这些模式刻划了在运行时难以跟踪的复杂的控制流,将程序员的注意力从控制流转移到对象间的联系方式上来。职责链(chain of responsibility)使多个对象都有机会处理请求,从而避免请求的发送者和接收者之间的耦合关系。将这些对象连成一条链,并沿着这条链传递该请求,直到有一个对象处理它为止

2014-08-08 15:07:40 742

原创 设计模式-结构型模式(读书笔记)

结构型模式涉及到如何组合类和对象以获得geng

2014-08-06 14:38:34 706

原创 MooseFS学习-概述

MFS(MooseFS)是一个容错的、网络分布式文件系统,是GFS的开源实现。它把数据分散在多个物理机上,对外展现为一个整体资源。功能:

2014-07-29 11:53:58 925

转载 可伸缩性最佳实践:来自eBay的经验

看到一篇关于系统可伸缩性(可扩展)的文章,eBay的架构师Randy Shou

2014-07-24 13:34:03 651

原创 Amazon Dynamo论文学习

Dynamo是一个key-value数据存储系统,具有高ku

2014-07-18 18:38:19 972

转载 常用推荐算法

推荐系统在互联网中有很多应用场景,如广告、电子商务、社区论坛

2014-07-10 15:22:10 974

原创 linux下进程间通信

共享内存两个或更多进程访问同一块内存

2014-07-08 16:36:21 635

原创 很好的设计-服务端网络请求处理模型

几个月前学习了公司内部的网络编程框架,结果zuij

2014-06-27 16:10:49 1491

原创 redis系列-主从复制

redis自身提供了主从的机制,通过配置可以实现数据的备份

2014-06-03 17:06:55 973

原创 Redis系列-冷知识

下面是一些看了,但觉得用处不大,不记下又可惜的

2014-05-29 20:03:46 1170

Flex-IFrame

适用于Flex3/4,用于在Flex中嵌入网页

2012-03-16

HDFS存取实例(java)

hdfs 上传 下载 客户端 代码 java

2011-08-29

Tuscany SCA与Spring、Hibernate整合实例-简洁方法

Tuscany SCA与Spring、Hibernate整合实例-简洁方法。为了控制大小,把项目lib中的jar都删了...

2011-07-19

Flex_Spring3_Hibernate3整合Demo

Flex_Spring3_Hibernate3整合Demo,使用RemoteObject调用java代码。主要配置为applicationContext.xml,web.xml,services-config.xml,remoting-config.xml。另外要引入SpringFactory类。

2011-07-18

json-rpc-java-1.0源代码

json处理源代码,如jsonArray,JsonObject。使用json远程调用源代码。

2011-05-03

lockdir 文件加密

文件加密 u盘加密,不建议下载,上传只为自己使用方便

2010-12-30

Java Servlet API

Java Servlet API chm格式,中文的,chm格式,下载后要是不能打开,就更改格式,重名为**.chm

2010-09-29

maven2快速入门教程

maven教程,里面有三个,全为txt格式,用于快速了解、使用maven

2010-07-16

软考2008下半年系统分析师下午试题I分析与解答.rar

软考2008下半年系统分析师下午试题I分析与解答.rar

2010-05-23

软考2008下半年系统分析师下午试题Ⅱ分析与解答.rar

软考2008下半年系统分析师下午试题Ⅱ分析与解答.rar

2010-05-23

软考2008下半年系统分析师上午试题分析与解答.rar

软考2008下半年系统分析师上午试题分析与解答.rar

2010-05-23

2008年上半年系统分析师试题分析与解答.rar

2008年上半年系统分析师试题分析与解答.rar

2010-05-23

2007年系分下半年试题分析与解答.rar

2007年系分下半年试题分析与解答.rar 系统分析师 下半年 试题 答案

2010-05-23

系统分析师考试历年试题及解答合.CHM

系统分析师考试历年试题及解答合.CHM 到06年

2010-05-23

2007年系分上半年试题分析与解答.rar

2007年 系分 上半年 试题 分析 解答 答案

2010-05-23

系统分析师经典论文五篇.doc

系统分析师经典论文五篇.doc 五篇系统分析师论文 借鉴用

2010-05-23

1996--2009系统分析师试题.rar

系统分析师历年试题 真题 部分为word,部分是pdf

2010-05-23

系统分析师经典教材_Word版

系统分析师经典教材_Word版有计算机系统知识、程序语言、操作系统等等

2010-05-23

软件设计师考试历年试题及解答合订本.CHM

软件设计师考试历年试题及解答合订本.CHM

2010-03-01

软件设计师考试同步辅导下午科目

软件设计师考试同步辅导下午科目 电子书 pdf格式

2010-03-01

软件设计师考试同步辅导上午科目

软件设计师考试同步辅导上午科目 电子书 pdf格式

2010-03-01

计算机考试经典英文词汇荟萃

计算机 考试 经典英文 词汇 荟萃

2009-05-22

RPG 教程 源代码

RPG 教程 源代码 游戏开发 Directx 对于有C++基础的人很快就可以进入RPG的实战开发。这教程好!打开压缩包里面的html即可开始教程阅览!强烈推荐那些想写游戏,而又不知所措的人!

2009-05-06

DirectX 9入门教程 Beginning Directtx 9

DirectX 9入门教程 Beginning Directtx 9 英语教材 全面介绍Directx9, 有助于渗入理解

2009-05-06

Directx 教程

Directx 教程 相当实用 便于初学者入门 阅读方便

2009-05-06

ssd8 选择题 choice

卡内基教程 ssd8 全部选择题 choice

2009-05-06

c++ 3D 游戏开发实例教程 chm

c++ 3D 游戏开发实例教程 chm文档第一回:开发环境 第二回:3D基本概念 第三回:第一个D3D程序 第四回:渲染顶点 第五回:渲染索引顶点 第六回:摄象机 第七回:灯光 第八回:纹理 第九回:3D模型(.x)

2009-04-10

vc++ 开发五子棋 视屏

vc++ 开发五子棋 视屏 讲述详细,有源代码

2009-04-10

网络游戏开发 英文教材 chm

网络游戏开发 chm 文档 英文教程 WinSock2 游戏编程 网络游戏开发 101 异步 Sockets 编程指南   多用户的服务器/客户模式聊天工具的开发   TCP/IP 协议介绍摘要   如何设计一个多人游戏   多人游戏的本质   制作一套网络消息引擎   使用统计学来预测网络上游戏者的动作   如何排除网络延迟

2009-04-10

C++ 游戏开发 教程

C++ 游戏开发 教程 实例 源代码 各种经常使用到的开发案例,代码详细 chm文档

2009-04-10

ssd4 exercise 8

卡内基教程 练习8 ssd4 exercise8

2009-04-10

ssd4 exercise 7

ssd4 exercise 7 卡内基4练习7

2009-04-10

HTTP1.1与HTTP1.0的比较

HTTP1.1与HTTP1.0的比较 中文的 你可以翻译成英文嘛

2009-04-10

java 反编译工具 jad和 用法

java 反编译工具 jad 安装文件和使用方法

2009-04-05

ssd8 卡内基 教程 chm

ssd8 卡内基梅隆 教程 chm文档 英语

2009-04-05

软件设计师考试大纲与培训指南(2009版)

软件设计师考试大纲与培训指南 (2009版) pdf

2009-02-18

c# 只允许运行一个实例

c# 只允许运行一个实例 代码 和 可运行程序

2009-02-16

2008下半年软件设计师考试试卷和答案

2008 下半年 软件设计师考试 试卷和答案 总共两张试卷,一个专家答案,pdf格式

2009-02-16

2008年上半年系统分析试卷

系统分析师试卷 2008年上半年 总共有三部分 选择 案例 论文

2009-02-16

java 图形界面美化

java图形界面的美化方法,里面有几个皮肤,以及皮肤的使用,和皮肤下载的地址

2008-12-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除