自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 最短编译距离(Minimum Edit Distance)算法及java实现

最近学习一些查询纠错的问题,用到此算法,因此,在网上找了许多资料(其实详尽资料不多),并加入自己的一些理解,具体描述如下:  最短编译距离给定任意两个字符串,比如:str1=“abcd”和str2=“gbcdz”,计算这两个字符串间的相似度。计算两字符串的相似度可等价于计算将str1变换到str2所需要的最少步骤。  问题分析:  为计算将str1变换到str2所需最小操作步骤,必须先

2014-01-07 17:29:01 2023

原创 Ubuntu mysql本地和mysql客户端不能访问和2003不能连接到服务器问题解决方法

linux 下直接安装mysql方法:sudo apt-get installmysql-server,之后遇到没意思起来不能访问,下面列出解决方法一、首先授权问题:GRANT ALL PRIVILEGES ON *.* TO 'user'@'%' IDENTIFIED BY 'password' WITH GRANT OPTION;如果你想允许用户user从ip为10.5.1.1的主

2013-03-21 13:36:23 2220

转载 eclipse打包总结,包括jar、bat以及exe文件

首先打成jar包1、没有其他类库jar文件和插件菜单“File”-->“Export”基本上默认就可以,记得next到最后,然后选中主类,否则就会出现Failed to load Main-Class manifestattribute from... 的错误如果没有使用其他插件啊,类库等,以上的步骤就可以了    2、有其他jar的类库先将那些类包含进来:右键点该

2013-03-16 13:47:04 1921

原创 中科院中文分词在java中调用详解(ICTCLAS2013版)

在中文分词的时候,现在流行的有很多,下面主要介绍中科院中文分词,现在中科院地址是http://ictclas.nlpir.org/首先也是开始调用这个接口,调用成功后觉得应该共享出来,让更多人去使用。然后主要是介绍一下怎么用使用汉语分词系统怎么去调用。必须先在上面那个网址下载NLPIR汉语分词系统,除此之外还要下载NLPIR-ICTCLAS2013-Win-32-JNI(u0114)的

2013-03-14 21:20:17 4583 17

原创 <script language= "javascript " for= "window " event= "onload " /> 的问题解读

EVENT   event   设置或获取脚本编写用于的事件   FOR   htmlFor   设置或获取绑定到事件脚本的对象。 实际上是语句的缩写 相当于              //   绑定         window.attachEvent( "onload ",function()   {          })

2013-03-06 10:22:47 926

转载 java.lang.OutOfMemoryError: PermGen space的问题及修改JVM的内存大小方法

今天做项目时突然遇到这样的问题,在网上搜到这样解决方法,转载供大家参考PermGen space的全称是Permanent Generation space,是指内存的永久保存区域OutOfMemoryError: PermGen space从表面上看就是内存益出,解决方法也一定是加大内存。说说为什么会内存益出:这一部分用于存放Class和Meta的信息,Class在被 Load的时候被放

2013-02-26 14:45:02 436

原创 基于规则和基于统计的区别、方法简介

最近在网络上一直在了解有关基于规则和基于统计的方法的文章,但是觉得说的还是很笼统,为此,根据自己所做的工作参考一些材料聊聊自己的认识,说的较为简单,希望大家能给予批评指正!说起基于规则和基于统计就不能不说一下有关NLP的一些基本研究方法,首先这谈谈理性主义和经验主义在哲学上的不同之处:其一就是对语言知识来源不同的认识:理性主义认为人的很大一部分语言知识都是与生俱来的,由遗传决定;经

2013-01-15 21:12:07 8392

转载 Lucene中倒排索引原理

1.简介倒排索引源于实际应用中需要根据属性的值来查找记录。这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。由于不是由记录来确定属性值,而是由属性值来确定记录的位置,因而称为倒排索引(invertedindex)。带有倒排索引的文件我们称为倒排索引文件,简称倒排文件(invertedfile)。倒排文件(倒排索引),索引对象是文档或者文档集合中的单词等,用来存储这些单词在一

2013-01-08 10:21:14 1029

转载 K-MEANS算法

K-MEANS算法的工作原理及流程(zhuan)K-MEANS算法:输入:聚类个数k,以及包含n个数据对象的数据库。输出:满足方差最小标准的k个聚类。处理流程:       (1) 从 n个数据对象任意选择 k个对象作为初始聚类中心;(2)根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离;并根据最小距离重新对相应对象进行划分;(3)重新计算每个(有变

2013-01-08 10:13:26 797

转载 搜索引擎中查询纠错概述

1. 背景介绍    搜索引擎的输入查询中,有相当一部分是带输入错误的查询。而提交有错误的查询给搜索引擎,通常得不到好的搜索结果,返回结果数很少并且和用户的期待相差很远,会严重影响了用户的使用体验。 如:                                “火箭队对振勇士直拨”直接用这样的查询,显然不可能给用户找到正确的网页。 但是,如果能自动地对查询进行纠错,修改成符合用

2013-01-08 09:08:05 1303

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除