自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

无限大地NLP_空木的专栏

自然语言处理、内容推荐、python

  • 博客(5)
  • 资源 (13)
  • 收藏
  • 关注

转载 Eclipse控制台中的中文输出乱码问题

前两天刚刚装了一个MyEclipse,今天用了一下,却发现,每次想要在控制台上输出中文时,总是以乱码显示的。查了很多资料,对算是搞明白,怎么回事。首先,在这里先解释下,MyEclipse(其实Eclipse也是一样)中,对于中文输出的控制(个人意见,仅供参考)当我们创建一个Java文件时,可以对该文件的编码格式进行调整:选中要修改的Java文件,点击选择但是输出到控制台的时

2014-06-18 17:20:19 1186

转载 Java读取中文文件出现乱码解决过程

前些天在读取一个UTF-8文件时,中文出现乱码,现在将处理过程简单记录如下:1. 首先看现象。2.确认一下文件的格式为UTF-8。3.首先想到的处理方法是将读取的内容转换一下,可是结果是有的字是乱码。4.修改WORKSPACE默认编码为UTF-8。结果好像没问题了,但是放到服务器上后发现还是不行。5.如果指定读取时的编码,看看结果怎样。6.上图中有个问号

2014-06-18 17:17:39 1039

转载 java语法---mkdir()和mkdirs()

mkdir()只能新建一个文件夹,而且只能是单层的父文件夹或已存在父文件夹的子文件夹。如想新建一个多层文件夹"/mnt/sdcard/feicui/upload" ,得先建一个"/mnt/sdcard/feicui"文件夹,再建一个"/mnt/sdcard/feicui/upload"文件夹mkdirs()可以新建多层文件夹如下所示。直接将多层文件夹建成。

2014-06-17 09:38:57 1352

转载 xml结点的遍历

dom4j通过ElementIterator对xml节点进行遍历xml文件:a19mathenglish这里先获取student节点。Element stu;然后获取这个节点的子节点course的iterator对象Iterator it=stu.elementIterator("course");while(itr.hasNext())

2014-06-17 09:10:08 731 1

原创 纪录片---BBC之睡眠十律笔记

1.热度并不是让人犯困的原因,而是体温在此之后

2014-06-02 09:57:09 1710

nlp停用词表

常用停用词词表 import pickle stopwords = pickle.load(open('stopWords.pkl','r'))

2019-03-10

conll2000的数据

http://www.chokkan.org/software/crfsuite/tutorial.html教程里 wget http://www.cnts.ua.ac.be/conll2000/chunking/train.txt.gz,wget不下来的时候,使用这份数据

2018-08-10

genia tagger

GENIA Tagger - part-of-speech tagging, shallow parsing, and named entity recognition for biomedical text -

2015-04-23

Python标准库

本书介绍了各种python代码库,介绍了python各种包的使用,python爱好者、开发者必看的一本枕边书。

2014-11-02

ICTPOS汉语词性标记集.doc

ICTPOS汉语词性标记集.doc定义了:计算所汉语词性标记集,对分词工具分词后的词性详细分类定义

2014-10-26

txt_to_xml.jar包

txt文件转成xml格式的文件,不是直接改后缀那么简单,想要得到标准的xml格式的文件,需要使用一些工具。

2014-04-29

算法导论-电子书

IT界,没看过《算法导论》的,可以回家了,最为基础的书籍,关于算法和数据结构方面的。神书,不解释

2014-04-22

机器学习实践指南

群里的一个朋友写的书,关于机器学习方面的,大家可以看看。

2014-04-22

python精要参考

虽然关于python语言的学习类的基础书一大堆,但是精简的却很少,《python精要参考》没那么多废话,确实可以参考参考

2014-04-22

计算机编程艺术

神书,不解释,《计算机编程艺术》,关于编程的一切技巧介绍之类的

2014-04-22

自然语言标注

自然语言处理,如何标注自然语言的有些方法,是一本好书!

2014-04-22

PYTHON自然语言处理中文翻译 NLTK

中文版的《python自然语言处理》,很少,做自然语言处理这块的,可以参考参考。

2014-04-22

Deep Learning 实战之 word2vec

关于word2vec的介绍,并且介绍了一些模型,像是统计语言模型,Log-Linear模型,以及介绍了分布式实现word2vec。很好的参考学习word2vec的资料

2014-03-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除