自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

吴家齐的专栏

IT苦逼男

  • 博客(18)
  • 资源 (4)
  • 收藏
  • 关注

原创 java向MySQL数据库插入记录时出现中文乱码问题

在数据库连接字符串中jdbc:mysql://localhost:3306/itat_hibernate?characterEncoding=UTF-8

2014-10-29 13:00:14 569

转载 WebService到底是什么?

一、序言  大家或多或少都听过WebService(Web服务),有一段时间很多计算机期刊、书籍和网站都大肆的提及和宣传WebService技术,其中不乏很多吹嘘和做广告的成分。但是不得不承认的是WebService真的是一门新兴和有前途的技术,那么WebService到底是什么?何时应该用?   当前的应用程序开发逐步的呈现了两种迥然不同的倾向:一种是基于浏览器的瘦客户端应用程序

2014-10-28 11:04:43 497

转载 spring 使用annotation替代xml配置实例(spring实现mail简单实现)

pring的配置类,这个是spring3.0的新特性,主要是想将以前的xml形式的配置模式转换成这种标识模式,相关内容可参考spring官方文档\spring-framework-3.0.3.RELEASE\docs\spring-framework-reference\html\beans.html的后面关于@Configuration那部分内容:package com.guan.cha

2014-10-27 14:41:03 817

转载 "ORA-00942: 表或视图不存在 "的原因和解决方法

采用Oracle数据库,使用Powerdesigner设计,生成Sql文件导入后查询出现“ORA-00942: 表或视图不存在 ”,很是郁闷,这个问题以前出现过,当初解决了,但因好久没有使用,这次竟然忘了,害得我浪费了好些时间,为了避免再次忘记,将它记下来,同时和大家一起分享。1、问题产生的原因  Oracle 是大小写敏感的,我们创自己写Sql脚本创建表的时候Oracle会自动将

2014-10-15 15:01:03 851

转载 Spring基于 Annotation 的简单介绍

Spring 自 2.0 版本开始,陆续引入了一些注解用于简化 Spring 的开发。@Repository 注解便属于最先引入的一批,它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO 类上即可。同时,为了让 Spring 能够扫描类路径中的类并识别出 @Repository 注解,需要在 XML 配置文件中启用 Bean 的自动扫描功能,这

2014-10-09 13:36:16 470

转载 Spring注解详解

概述注释配置相对于 XML 配置具有很多的优势:它可以充分利用 Java 的反射机制获取类结构信息,这些信息可以有效减少配置的工作。如使用 JPA 注释配置 ORM 映射时,我们就不需要指定 PO 的属性名、类型等信息,如果关系表字段和 PO 属性名、类型都一致,您甚至无需编写任务属性映射信息——因为这些信息都可以通过 Java 反射机制获取。注释和 Java 代码位于一个文件中,

2014-10-09 12:11:59 409

转载 JAVA新手之学习Java语言的六大要点

Java的学习是比较复杂的,主要表现在相关的一系列平台、规范和协议上。有经验的Java程序员都知道,只掌握了Java语言本身很难开发应用程序。本文不讨论这些复杂的概念,而是我是在北京参加的培训,现在从初学者的角度,对于Java语言本身的学习提出自己的见解和建议。本文的讨论基于以下假设:1. 学习的目的是为了将来进行应用程序的开发,而不是进行语言理论研究2. 将来的应用开发是

2014-10-09 10:57:08 544

转载 养成良好的java编程习惯

养成良好的java编程习惯1.        应该在每个程序的开始都加上注释,解释该程序的目的、作者以及程序最后一次被修改的日期和时间。2.        使用空行和空格来增强程序的可读性。3.        按照约定,类名标识符中的第一个字母大写,同时将其后每个单词的首字母都大写。java程序员认为这样的标识符通常表示java中的类,所以遵守这个约定,使其可读性增强。

2014-10-08 13:40:10 657

转载 Windows8上面安装Oracle11g时,安装程序报错:[INS-13001]环境不满足最低要求

Oracle 11g 时,安装程序报错:[INS-13001]环境不满足最低要求,解决方法:在安装文件的/stage/svu文件夹下面找到文件 cvu_prereq.xml文件,修改为如下(添加windows 8 相关字段): -->

2014-10-08 13:06:56 2052

转载 二元语法模型与viterbi算法分词

注意:本篇博文标红字部分为一处笔误的改正。非常感谢猎兔网 开发工程师 罗刚指出错误。欢迎大家光临我的博客指正各种思维不周,本人不拒绝严格的批评,只要能指出具体错误,和改进方案采用这种方法首先要弄懂1.什么是二元语法模型:二元语法模型也就是一阶马尔科夫链,更通俗的说法是:一个词出现与否,仅有它前面一个词有关。举个例子:P(成|结合)*P(结合)>P(合成|结) *P(结)表示 “

2014-10-08 11:34:53 2620

转载 中文分词词典构造简述

中文分词词典构造简述在分词系统中常用的分词词典机制有:(1)基于整词二分;(2)基于TRIE索引树;(3)基于逐字二分.一、基于整词二分的分词词典机制这是一种广为使用的分词词典机制.其结构通常分为三级,前两级为索引,如图3.1听示。图 3.1 基于整词二分的分词词典机制 1.首字散列表词首字散列函数根据汉字的国标区位码给出。通过一次Hash运算即

2014-10-05 21:49:58 4354

转载 文本特征提取方法研究

一、课题背景概述文本挖掘是一门交叉性学科,涉及数据挖掘、机器学习、模式识别、人工智能、统计学、计算机语言学、计算机网络技术、信息学等多个领域。文本挖掘就是从大量的文档中发现隐含知识和模式的一种方法和工具,它从数据挖掘发展而来,但与传统的数据挖掘又有许多不同。文本挖掘的对象是海量、异构、分布的文档(web);文档内容是人类所使用的自然语言,缺乏计算机可理解的语义。传统数据挖掘所处理的数据是结构化

2014-10-05 21:41:18 1001

转载 分词中的HMM

1.       首先来说一下马尔科夫链。 一个事件序列发生的概率可以用下面的概率论里面的乘法公式展开 P(w1,w2,…wn) = P(w1)P(w2|w1)P(w3| w1 w2)…P(wn|w1 w2…wn-1) 乘法公式的证明非常有意思,它本身就是一个递推的过程, 根据条件概率的定义:P(A|B) = P(AB)/ P(B)

2014-10-05 21:39:56 628

转载 NLP常用工具

各种工具包的有效利用可以使研究者事半功倍。以下是NLP版版友们提供整理的NLP研究工具包。同时欢迎大家提供更多更好用的工具包,造福国内的NLP研究。*NLP Toolbox  CLT http://complingone.georgetown.edu/~linguist/compling.html  GATE http://gate.ac.uk/  Natural La

2014-10-05 21:36:12 581

转载 开源中文分词FudanNLP

推荐FudanNLP,这是一个复旦大学计算机学院开发的开源中文自然语言处理(NLP)工具包Fudan NLP里包含中文分词、关键词抽取、命名实体识别、词性标注、时间词抽取、语法分析等功能,对搜索引擎、文本分析等极为有价值。开源项目地址为:http://code.google.com/p/fudannlp/ DEMO地址为:http://jkx.f

2014-10-05 21:33:05 908

转载 自然语言处理与中文分词的难点总结

中文自动分词指的是使用计算机自动对中文文本进行词语的切分,即像英文那样使得中文句子中的词之间有空格以标识。中文自动分词被认为是中文自然语言处理中的一个最基本的环节。中文分词的难点· 未登录词,基于词库的分词方法往往不能识别新词、特定领域的专有词。人名、机构名、地名、产品名、商标名、简称、省略语等都是自动分词的难点。· 切分歧义,使用基于n-gram的切词方法往往不能

2014-10-05 21:31:07 7907

转载 自然语言处理--中文分词之机械分词

说到自然语言处理,对于中文首当其冲的就是分词。    和西方语言不同,中文句子中不像英语,每个单词间有空格隔开,而是全部连在一起,词间没有明显的界限。这就为我们的翻译、检索等等更高级的信息处理带来了不小的麻烦,怎样将一句话中的关键词提取出来,便成为了中文信息处理首先要解决的问题,这就是我们所谓的分词。    现有的分词算法可分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和

2014-10-05 21:25:19 3357

转载 中文分词:之Trie树

中文分词一直都是中文自然语言处理领域的基础研究。目前,网络上流行的很多中文分词软件都可以在付出较少的代价的同时,具备较高的正确率。而且不少中文分词软件支持Lucene扩展。但不管实现如何,目前而言的分词系统绝大多数都是基于中文词典的匹配算法。 在这里我想介绍一下中文分词的一个最基础算法:最大匹配算法 (Maximum Matching,以下简称MM算法) 。MM算法有两种:一种正向

2014-10-05 21:10:00 835

VS2010构建ASP.NET三层架构实例演示代码

项目代码简单显示一张表的记录,核心是掌握怎样构建基于三层架构的asp.net项目。

2014-04-18

VC6LineNumberAddin插件及注册文件

VC6LineNumberAddin插件及注册文件,解压后把VC6LineNumberAddin.dll拷贝到VC6安装路径下的Microsoft Visual Studio/Common/MSDev98/AddIns文件夹

2013-12-29

如何利用Google chart API产生二维码

本实例提供了一个edittext 用来输入生成的二维码中包含的信息,当user点击按钮之后,会自动生成相应的二维码。

2013-12-24

tetgen中文手册

目前网上很难找到tetgen手册的中文版,所以将我半年以来学习tetgen时翻译的成果分享给大家,希望有兴趣的朋友能可以更加完善。

2013-12-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除