- 博客(325)
- 资源 (12)
- 收藏
- 关注
原创 JVM学习索引页
jvm(java虚拟机)原理内存管理:以下下三篇侧重于内存的管理java虚拟机内存管理机制(一):JVM内存管理总结【分享】java虚拟机内存管理机制(二):了解JVM的内存管理与垃圾回收java虚拟机内存管理机制(三):我主管写的一些jvm内存管理知识 以下文章侧重与应用Java虚拟机(JVM)中的内存设置详解 讲解如何设置参数以便使用最大限度地提高程序运行效率Java虚拟机支持的最大内存限制 主要讲解现在主要jdk的内存限制
2010-11-30 11:26:00 1911
原创 本博客中中文分词索引页
中文分词系统理论:搜索引擎技术揭密:中文分词技术 这篇文章概念讲得比较清晰搜索引擎之中文分词(Chinese Word Segmentation)简介中文自动分词 ——摘自《搜索引擎 ——原理技术与系统》 摘自一本书,算法思想讲得不错话说搜索引擎分词浙大一位同学的中文分词算法现有搜索引擎的分析:百度的分词算法现有的一些技术:几个免费的中文分词模块【转】开源中文分词软件分析java语言的开源工具:http://open-open.com/74.htm ICTCLAS 计算所汉语词法分析系统主页:http
2010-11-05 17:45:00 3301
转载 linux date指令
<br /> 功能说明:显示或设置系统时间与日期。 <br /> 语 法:date [-d <字符串>][-u][+%H%I%K%l%M%P%r%s%S%T%X%Z%a%A%b%B%c%d%D%j%m%U%w%x%y%Y%n%t] 或date [-s <字符串>][-u][MMDDhhmmCCYYss] 或 date [--help][--version] <br /><br /> 补充说明:第一种语法可用来显示系统日期或时间,以%为开头的参数为格式参数,可指定日期或时间的显示格式。第二种语法
2011-05-17 17:23:00 4146
原创 java对象的强引用,软引用,弱引用和虚引用
<br /> 众所周知,java中是JVM负责内存的分配和回收,这是它的优点(使用方便,程序不用再像使用c那样操心内存),但同时也是它的缺点(不够灵活)。为了解决内存操作不灵活这个问题,可以采用软引用等方法。<br /> <br /> 在JDK1.2以前的版本中,当一个对象不被任何变量引用,那么程序就无法再使用这个对象。也就是说,只有对象处于可触及状态,程序才能使用它。这 就像在日常生活中,从商店购买了某样物品后,如果有用,就一直保留它,否则就把它扔到垃圾箱,由清洁工人收走。一般说来,如果物
2011-05-05 21:00:00 47651 9
转载 在myeclipse中如何拷贝一个web工程
<br /> <br />在MyEclipse中,经常练习的时候需要建立多个工程,但是为了方便,通常的作法是:复制一个工程,然后直接粘贴,但是,部署以后会发现,使用新的工程名访问不了,报404错误。 <br /><br />其原因是没有修改Web Context-root <br /><br />修改方法为: <br /> 选中项目,点右键-->Properties-->MyEclipse-->Web-->Context Root <br />修改Web Context-root的值为新的工程名。 <
2011-04-14 16:45:00 7286
原创 Jboss调优——最佳线程数
在设置jboss的参数中,maxThreads(最大线程数)和acceptCount(最大等待线程数)是两个非常重要的指标,直接影响到程序的QPS。本文讲解jboss连接的运行原理,以及如何设置这两个参数。
2011-04-12 21:40:00 24666 2
原创 数据库
<br />数据库基础知识:<br /> <br />数据库索引<br />数据库ACID原理<br />SQL四种语言:DDL,DML,DCL,TCL<br />CAP理论与分布式数据库<br /> <br /> <br /> <br />MySQL学习<br />http://blog.csdn.net/lengyuhong/archive/2010/12/05/6056632.aspx<br /> <br /> <br /> <br />
2011-03-29 21:22:00 3597
原创 简述一个大型交易网站的发展旅程
一、功能定义: –商品:展示商品,商品管理,……–交易:创建交易,交易管理,……–用户:注册用户,信息查询,用户管理,…… 二、技术发展第一版: 出于快速开发的考虑,第一版往往采用单台机器构建(这里采用java技术,下同),这样开发方便而且快速,采用的技术甚至可以是最简单的jsp,servlet等。 它的技术特点: •三个功能模块 •一个数据库中的三个表 •连接数据库使用了JDBC •模块之间的调用是JVM内部的方法调用第二版:
2011-03-25 20:35:00 3688
转载 新浪微博的架构发展历程
<br />新浪微博的架构发展历程http://www.sina.com.cn 2010年11月16日 17:57 新浪科技微博平台首席架构师杨卫华<br /> 新浪科技讯 11月16日下午消息,由新浪微博(http://t.sina.com.cn)(http://t.sina.com.cn)主办的中国首届微博开发者大会在北京举行,这是国内微博行业的首场技术盛宴。作为国内微博市场的绝对领军者,新浪微博将在此次大会上公布一系列针对开发者的扶持政策,以期与第三方开发者联手推动微博行业的整体发展。图为微博平
2011-03-23 21:04:00 3519
转载 一致性 hash 算法( consistent hashing )
<br /> 一致性 hash 算法( consistent hashing )<br />张亮<br />consistent hashing 算法早在 1997 年就在论文 Consistent hashing and random trees 中被提出,目前在 cache 系统中应用越来越广泛;1 基本场景<br />比如你有 N 个 cache 服务器(后面简称 cache ),那么如何将一个对象 object 映射到 N 个 cache 上呢,你很可能会采用类似下面的通用方法计算 object 的
2011-03-23 18:51:00 3206
原创 Java中try catch finally的注意点
<br /> 在java中,try ...catch...finally 这个知识点说简单也简单,毕竟只是一个固定结构;说难也难,因为它会出现我们意想之外的结果,这里我摘录些可能出现问题的情况:<br />情况一:<br />public class TestTryReturn { public static void main(String[] args){ TestTryReturn ttr = new TestTryReturn(); System.ou
2011-03-13 20:25:00 6403
转载 各种排序方法总结
<br />原文出自:http://hxraid.javaeye.com/blog/646300<br /> <br /> <br /> <br />们首先总结一下《排序结构专题1-4》中的十种方法的性能((N个关键字的待排序列)):<br /><br /> <br /><br /><br />1、 O(N^2) 级别的普通排序算法,我们用C++ 的随机函数rand() 产生的随机数进行排序,并计算耗费时间。<br />其中分别随机生成1W,3W,5W... 19W(增量为2W)共十组待排序列进行测试。得到
2011-03-13 19:41:00 4685
原创 快速排序(二) jdk源码中如何优化快速排序
<br /> 快速排序是一种相当棒的排序方案,相关理论内容可以参见快速排序(一) 原理介绍<br /> 在jdk的[java.util.Arrays]类中,有一个sort的函数,它实现对很多数据结构进行的排序方法,其中sort(int[] a)中主要使用的是优化后的快速排序法,本文正是基于此来讲解如何优化快速排序算法。<br /> <br />java源代码:<br />public class SourceSort { public static void main(String[]
2011-03-13 19:31:00 5273
原创 快速排序(一) 原理介绍
一、基本思想 快速排序(Quicksort)是对冒泡排序的一种改进。由C. A. R. Hoare在1962年提出。它的基本思想是:通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列。二、 设要排序的数组是A[0]……A[N-1],首先任意选取一个数据(通常选用第一个数据)作为关键数据,然后将所有比它小的数都放到它前面,所有比它大的数都放到
2011-03-10 21:25:00 9755 2
转载 Lucene学习总结之三:综述Lucene的索引文件格式
原文:http://www.lucene.com.cn/about.htm#_Toc43005322在Lucene的web站点上,有关于Lucene的文件格式的规范,其规定了Lucene的文件格式采取的存储单位、组织结构、命名规范等等内容,但是它仅仅是一个规范说明,并没有从实现者角度来衡量这个规范的实现。因此,我们以下的内容,结合了我们自己的分析与文件格式的定义规范,以期望给出一个更加清晰的文件格式说明。具体的文档规范可以参考后面的文献2。 首先在Lucene的文件格式中,以字节为基础,定义了如下的数
2011-03-06 20:20:00 3319
转载 Lucene学习总结之五:细述Lucene的索引文件格式(2)
四、具体格式上面曾经交代过,Lucene保存了从Index到Segment到Document到Field一直到Term的正向信息,也包括了从Term到Document映射的反向信息,还有其他一些Lucene特有的信息。下面对这三种信息一一介绍。4.1. 正向信息Index –> Segments (segments.gen, segments_N) –> Field(fnm, fdx, fdt) –> Term (tvx, tvd, tvf)上面的层次结构不是十分的准确,因为segments.gen和seg
2011-03-06 16:06:00 3447
转载 Lucene学习总结之四:细述Lucene的索引文件格式(1)
原文地址:http://forfuture1978.javaeye.com/blog/546824ps:这篇文章是以lucene2.9.0 版本进行讲解的。Lucene的索引里面存了些什么,如何存放的,也即Lucene的索引文件格式,是读懂Lucene源代码的一把钥匙。当我们真正进入到Lucene源代码之中的时候,我们会发现:Lucene的索引过程,就是按照全文检索的基本过程,将倒排表写成此文件格式的过程。Lucene的搜索过程,就是按照此文件格式将索引进去的信息读出来,然后计算每篇文档打分(score)的
2011-03-06 15:03:00 3322
转载 Lucene学习总结之二:Lucene的总体架构
原文出处:http://forfuture1978.javaeye.com/blog/546808Lucene总的来说是:一个高效的,可扩展的,全文检索库。全部用Java实现,无须配置。仅支持纯文本文件的索引(Indexing)和搜索(Search)。不负责由其他格式的文件抽取纯文本文件,或从网络中抓取文件的过程。在Lucene in action中,Lucene 的构架和过程如下图,说明Lucene是有索引和搜索的两个过程,包含索引创建,索引,搜索三个要点。让我们更细一些看Lucene的各组件: 被索引的
2011-03-02 16:52:00 3743
转载 Lucene学习总结之一:全文检索的基本原理
原文:http://forfuture1978.javaeye.com/blog/546771一、总论根据http://lucene.apache.org/java/docs/index.html定义:Lucene是一个高效的,基于Java的全文检索库。所以在了解Lucene之前要费一番工夫了解一下全文检索。那么什么叫做全文检索呢?这要从我们生活中的数据说起。我们生活中的数据总体分为两种:结构化数据和非结构化数据。结构化数据:指具有固定格式或有限长度的数据,如数据库,元数据等。非结构化数据:指不定长或无固定
2011-03-02 16:21:00 7337
原创 java中的Properties文件操作使用举例
一、文件样式:二、config.default.properties中的内容:weightpath=D:/harrypotter/xml/weight.xmldicpath=D:/harrypotter/xml/dictionary.xmldictionarypath=D:/harrypotter/cpv_datasetCHANGEPI=1 CHANGEPN=1CHANGEPM=1CHANGEPIC=1CHANGEPIP=1name=zhujiadun 三、操作代码packa
2011-03-02 11:14:00 6055
原创 java相对路径设置
在java中相对路径的设置是一个比较头痛的问题:配置文件应该写在哪里,"/","./"等各自代表着什么含义,普通的java工程和jsp(servlet)的路径有什么不同,这都是我们特别需要留意的。不然在程序开发中会死得很惨(个人以前深有体会,看似很简单的路径设置,往往要花很多的时间才能搞定)。
2011-03-01 20:18:00 37147 2
转载 揭秘全球最大网站Facebook背后的那些软件
转自http://www.jobbole.com/entry.php/73 这篇文章简单介绍了facebook所使用的一些软件,虽不深入但很全面。 2010年6月,Google公布全球Top 1000网站。Facebook独占鳌头。 以Facebook现在的经营规模,诸多传统服务器的技术均将崩溃或根本无法支撑。那么面对5亿的活跃用户,Facebook的工程师们又将如何让网站平稳运转呢?伯乐在线 - 职场博客的这篇文章将展示Facebook的工程师完成这个艰巨任务所用到的一系列软件。 Faceboo
2011-03-01 15:30:00 1360
翻译 外文翻译_A Search-based Chinese Word Segmentation Method
A Search-based Chinese Word Segmentation Method 一个基于搜索的中文分词方法Xin-Jing Wang Wen Liu
2011-02-26 19:26:00 2327
转载 运用Jconsole监控JVM
Jconsole是JDK自带的监控工具。它用于连接正在运行的本地或者远程的JVM,对运行在java应用程序的资源消耗和性能进行监控,并画出大量的图表,提供强大的可视化界面。而且本身占用的服务器内存很小,甚至可以说几乎不消耗,不失为一款好工具。 Jconsole的使用方法,稍微复杂一些。 首先,来看看如何使用Jconsole 连接到远程linux服务器。 1. 在本地安装JDK 6.0版本。 2. 需要在远程服务器的jboss配置文件中,添加远程服务端口,并启
2011-02-22 16:26:00 25449 1
原创 Linux脚本(shell)编程(六) 循环
<br /> <br />while循环<br />while [ condition ] do 程序段落done <br /> <br /> <br />for循环,特别注意i的用法<br />for (( i=1 ;i<=5 ; i=i+1))do 执行的程序done<br /> <br />循环中,是有结束循环的语句,break的
2011-02-21 20:24:00 279
原创 Linux脚本(shell)编程(五) if 条件判断
基本格式if [ 条件判断表达式 ] ; then 当条件判断表达式成立是,可以执行的命令else 当条件判断表达式不成立时,可以执行的命令fi 基本格式二if [ 条件判断表达式一 ] ; then 当条件判断表达式y一成立是,可以执行的命令elif [ 条件判断表达式二 ] ; then 当条件判断表达式一不成立,条件表达式二成立是,可以执行的命令else 当条件判断表达式一与二不成立时,可以执行的命
2011-02-21 20:20:00 2785
原创 Linux脚本(shell)编程(四) 判断条件
1. test命令的测试功能 test命令用于检测系统文件及其相关属性,如检查某文件是否存在,检查某文件的权限等。判断当前目录下是否存在某文件jifeng可以用以下命令:test -e jifeng 但执行结果并不会现实任何消息,但最后可以通过$? 或 && 或 || 来展现整个过程。例如,上面的子类改写成test -e jifeng && echo "exit" || echo "not exit" 这样,最终结果可以告诉我们是“exit”,还是“not exit”。2. 其
2011-02-21 20:05:00 4570
翻译 外文翻译_Chinese Word Segmentation at Peking University
由于在淘宝实习阶段做的项目,主要是中文分词模块,因此大学毕业设计选择的题目是《基于电子商务的中文分词技术研究》,这篇是我的外文翻译文档——《Chinese Word Segmentation at Peking University》。
2011-02-19 14:38:00 2050 2
原创 linux下用rpm 安装jdk
1.下载jdk的rpm安装包,这里以jdk-6u21-linux-i586-rpm.bin为例进行说明下载地址:http://www.oracle.com/technetwork/java/javase/downloads/index.html2. 将jdk-6u21-linux-i586-rpm.bin 移动到合适的安装目录上,安装软件不要在/home路径下,这样很容易涉及到
2011-02-18 20:47:00 38440 3
原创 shell编程
shell脚本学习文章:Linux脚本(shell)编程(一) 简单入门HelloWorldLinux脚本(shell)编程(二) 基本语法Linux脚本(shell)编程(三) 文件操作
2011-02-18 17:47:00 2370
原创 Linux脚本(shell)编程(三) 文件操作
1. 判断文件是否存在 -e $filename例如:#!/bin/bashfilename=/home/jifeng/shell/fileif [ -e $filename ]then echo "$filename exited"fi 2. 判断文件是否为空[ ! -s $filename ]特别注意:如果文件存在且为空,-s代表存在不为空,!将他取反例子:#!/bin/bashfilename=/home/jifeng/shell/fileecho $filenam
2011-02-18 17:44:00 3917
转载 Linux scp 命令
<br /> <br />什么是SCP?<br /> scp是secure copy的简写,用于在Linux下进行远程拷贝文件的命令。scp 命令可以用来在SSH中同步和目录传输命令。cp只能在本机使用,scp就可以在服务器之间copy,而且是加密传输。最最重要的是,当你服务器硬盘变read only system时,只有scp可以帮你把文件移出来。另外,scp还非常不占资源,不会提高多少系统负荷,在这一点上,rsync就远远不及它了。虽然rsync比scp会快一点,但当小文件众多的情况下,rsync可以
2011-02-17 10:59:00 1692
转载 Linux进程管理指令
<br /><br />作者:北南南北<br />来自:LinuxSir.Org<br />摘要:本文讲述的时进程管理的基本概念和进程管理工具介绍;文中的重点对进程管理工具的分类介绍及应用举例,包括 ps、pgrep、top 、kill、pkill、killall、nice和renice 等工具。<br /><br /><br />1、程序和进程;<br /><br />程序是为了完成某种任务而设计的软件,比如OpenOffice是程序。什么是进程呢?进程就是运行中的程序。<br />一个运行着的程序,可能
2011-02-06 16:45:00 3662
转载 Linux 文件与目录权限
<br />一、文件和目录权限概述<br />在linux中的每一个文件或目录都包含有访问权限,这些访问权限决定了谁能访问和如何访问这些文件和目录。<br /><br />通过设定权限可以从以下三种访问方式限制访问权限:<br />1. 只允许用户自己(文件的创建者)访问;<br />2. 允许一个预先指定的用户组中的用户访问;<br />3. 允许系统中的任何用户访问。<br />同时,用户能够控制一个给定的文件或目录的访问程度。一个文件或目录可能有读、写及执行权限。<br />当创建一个文件时,系统会自
2011-02-06 16:31:00 1286
原创 Linux学习汇总
基础学习1.文件:Linux 目录体系inux 文件操作指令2. 进程进程管理linux下实现多线程同步(一)信号量(一) 基础知识信号量(二) 经典例子举例(一)信号量(三) 经典例题(二)3. 内存管理Linux中的内存管理——————————————————————————————————————————————————————————工具学习Linux viLinux环境下配置jboss—————————————————————————————————————————————————————————
2011-02-06 15:17:00 1649
原创 linux 文件操作指令
cd : 改变目录位置pwd : 显示当前目录的绝对路径ls : 显示文件名称,属性等cp : 复制文件或目录mv : 移动文件或者目录rm : 删除文件或目录mkdir: 创建目录rmdir: 删除目录
2011-02-06 15:04:00 1716
原创 Linux 目录体系
/ 根目录 │ ├boot/ 启动文件。所有与系统启动有关的文件都保存在这里 │ └grub/ Grub引导器相关的文件 │ ├dev/ 设备文件 ├proc/ 内核与进程镜像 │ ├mnt/ 临时挂载 ├media/ 挂载媒体设备 │ ├root/ root用户的$HOME目录 ├home/
2011-02-04 15:06:00 1532
lucene3.0.0的学习资料
2010-11-17
log4j-1.2.16.jar
2010-08-21
JUnit Jar 单元测试
2010-08-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人