- 博客(13)
- 资源 (46)
- 收藏
- 关注
原创 互联网搜索与挖掘原理
互联网搜索原理: 网页采集技术; 文本查重技术; 内容抽取技术; 信息预处理技术; 中文分词、实体识别技术; 布尔查询处理技术; 倒排索引构建于压缩技术; 搜索结果的评价; Top K检索技术; 基于向量空间的文档排名技术; 基于概率模型的文档排
2013-01-31 15:49:04 789
转载 传统向量空间模型的缺陷
传统向量空间模型的缺点: 1、它基于关键字的文档处理方法,依据的是词频信息,两个文档的相似度取决于共同词汇的数量,无法分辨自然语言的语义模糊性。 2、它假设词与词之间是相互独立的,一个关键字唯一代表一个概念或语义单元,而实际情况是文档存在很多的一词多义和同义词现象,因此这种假设很难满足实际情况。 3、文档中词与词往往存在一定的关联性,信息检索的本质就是语义的检索
2013-01-31 15:33:23 4598
转载 分类效果评价
一个分类器最主要的评测指标就是查准率(正确率)和查全率(召回率)。为了评价二分分类问题的性能,先做以下约定: a:正例测试文档被正确分类为该类的数量; b:负例测试文档被错误分类为属于该类的数量; c:正例测试文档被错误分类为不属于该类的数量; d:负例测试文档被正确分类为不属于该类的数量; 基于上面四个值,就可以定义下
2013-01-31 15:14:52 14167
原创 Java中的文件删除操作
import java.io.File;public class DeleteFile { public static void main(String args[]){ String str="c:/Autoexec.bat"; new File(str).delete(); } }
2013-01-25 21:06:31 599
原创 Java中文件的复制操作
import java.io.File;import java.io.FileInputStream;import java.io.FileOutputStream;import java.io.InputStream;public class CopyFile { public static void main(String[] args) { String str
2013-01-25 20:57:46 423
原创 文件移动 Java实现
import java.io.File;public class MoveFile { public static void main(String[] args) { String src="c:/Autoexec.bat"; String dest="d:/"; MoveFile mf=new MoveFile(); mf.move(src, des
2013-01-24 17:54:28 543
转载 熵和信息增益
信息论中广泛使用的一个度量标准,称为熵(entropy),它刻画了任意样例集的纯度。给定包含关于某个目标概念的正反样例的样例集S,那么S相对于这个布尔型分类的熵为: 其中,p+代表正样例,比如p+则意味着去打羽毛球,而p-则代表反样例,不去打球。 注意:如果S的所有成员属于同一类,那么S的熵为0;如果集合中正反样例的数量相等时,熵为1;如果集合中正反样例的数量不等时,熵介于
2013-01-21 10:58:07 7257 1
转载 Java经典算法题目面试题经常出现的
1、Fibonacci-费式数列问题说明: Fibonacci为1200年代的欧洲数学家,在他的著作中曾经提到:若有一只兔子每个月生一只小兔子,一个月后小兔子也开始生产。起初只有一只兔子,一个月后就有两只兔子,两个月后有三只兔子,三个月后有五只兔子(小兔子投入生产)……2、巴斯卡三角形(Pascal) 问题说明: 巴斯卡(Pascal)三角形基本上就是在解nCr ,因为三角形上的每一个数字各对
2013-01-06 11:24:00 1047
转载 JAVA(睿盟科技)面试题目
1.把一个小于十进制9999的二字节数字转换成16进制的数,让其的10进制和16进制是一样的。比如:十进制的9527转成十六进制的0×9527。2.base32是一种编码形式,每次取5bit。将”ABCDEFGHIJKLMNOPQRSTUVWXYZ”提取出来。例如:|-8bit-| |-8bit-| |-8bit-| |-8bit-| |-8bit-| |-8bit-| |-8bit-
2013-01-06 11:23:00 1360
转载 Java程序员笔试、面试题目
1. 面向对象编程的三大特性是什么,请简要阐述2. String 和StringBuffer的区别3. 说出ArrayList,Vector, LinkedList的存储性能和特性4. Collection 和 Collections的区别5. HashMap和Hashtable的区别6. final, finally, finalize的区别7. Overload和Ove
2013-01-06 11:21:52 1013
转载 IBM Java笔试题
1. 如下代码class A {A() { }}class B extends A {}哪两个说明是正确的?A. B类的构造器应该是 public.B. B类的构造器应该是没有参数C. B类的构造器应该调用this().D. B类的构造器应该调用super().答案:BD解析:默认构造器的修饰符只跟当前类的修饰符有关。 比如B如果是public的,则
2013-01-06 11:14:48 1745
转载 java试题
选择题(1'*15=15)1、下列正确的Java语言标识符是(C)A、-3.1415 B、+ok C、_test D、5file2、下面那一个是java保留关键字(D)A、String B、IF C、Int D、private3、下列关于注释语句的描述中,正确的一项是(C)A、以//开始的是多行注释语句B、以/*开始,*/结束的是单行注释C、以/**开始,*/结束的
2013-01-06 11:11:21 1532
转载 java中的内存泄漏
java中会存在内存泄露。如:int i,i2 return (i-i2) //when i为足够大的正数,i2为足够大的负数。结果会造成溢位,导致错误Java内存溢出的解决方案:一、java.lang.OutOfMemoryError: PermGen spacePermGen space的全称是Permanent Generation space,是指内存的永久保存区域,这块内
2013-01-06 11:09:48 563
Windows下cygwin+MyEclipse 8.5+Nutch1.2+Tomcat 6.0
2012-03-19
Cloud Security and Privacy
2011-08-22
云计算安全研究(中科院)
2011-08-22
云计算安全七宗罪、云计算安全七宗罪
2011-07-22
commons-fileupload-1.0-beta-1.jar、commons-beanutils-1.8.3.jar
2011-07-22
commons-fileupload-1.0-beta-1.jar、commons-beanutils-1.8.3.jar
2011-07-22
maven nexus 安装包.rar
2020-12-16
visit3.0.1_x64.exe
2019-08-14
DirectXRepair_v3.7修复工具
2018-05-26
学习Hibernate所用的下载包
2013-06-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人