自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (9)
  • 收藏
  • 关注

原创 sanford ner

按照如下语句直接调用ner模块识别时报如下错误 >>> from nltk.tag.stanford import NERTagger >>> st = NERTagger('stanford-ner-2014-06-16/classifiers/english.all.3class.distsim.crf.ser.gz','stanford-ner-2014-06-16/stanford-n

2016-03-22 19:59:04 758

原创 以文件为单位的分句、分词python封装脚本

利用nlpir进行分词时,需要考虑以下两个问题: 1、如何分句、分段 2、如何表示分词结果 在网上找了几个分句的脚本,感觉都有问题,就只好自己写了,虽然比较简单,但如果要做到面面俱到还是需要仔细考虑,标注采用xml文件,包括article、paragraph、sentence三层结构,代码已注释,大家自己看吧,这个脚本经过了几次测试,应该可以应付大多数正常的文本文件,如果有问题,欢迎反馈。

2016-03-20 15:52:14 658

原创 使用nlpir分词工具时字符编码问题

在进行中文自然语言处理时,首先要注意字符编码的转换问题。我在使用nlpir分词工具时遇到如下问题: 句子1:u'不断深化中缅睦邻友好和互利合作,符合两国和两国人民的根本利益。' 句子2:'不断深化中缅睦邻友好和互利合作,符合两国和两国人民的根本利益。' 两个句子的区别就在于句子1是解码后的unicode形式,句子2是utf-8编码,nlpir工具支持多种编码方式,但并不支持解码后的unico

2016-03-19 20:54:09 1374

深度学习笔记

Deep Learning(深度学习)学习笔记整理系列,非常好的深度学习入门资料,包含很多链接,让初学者少走很多弯路

2016-04-22

mallet-2.0.8RC3

最新版mallet以及相关教程、帮助,java下必备自然语言处理工具,包括HMM,MEMM,CRF,LDA等各种模型,以及多种优化算法,可以基于此完成你的多数自然语言处理课题及其他数据挖掘任务

2016-04-22

数学之美番外篇:平凡而又神奇的贝叶斯方法

对贝叶斯方法的系统论述,提升你对概率的理解,值得一读

2015-04-27

机器学习导论第二版课件

机器学习导论第二版课件完整版,适合对机器学习有兴趣的朋友

2015-04-27

intel ipp6.1 许可证

最新版本ipp性能库许可证,价值199美元,里面有安装说明

2010-06-29

NctAudioStudio3

目前比较新的NCT音频控件,能实现你所需要的所有功能,很好很强大

2010-03-23

程序员法则

工作之余看看,消遣消遣

2008-08-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除