自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

转载 matplotlib输出图象的中文显示问题(转载)

因项目需要输出中文统计图,选择matplotlib还不错。在其中使用中文发现有些问题。在网上找到的解决方案还不错。一、找到c:\python24\lib\site-packages\matplotlib\mpl-data\matplotlibrc (修改font.sans-serif、verbose.level两行代码)1、找到了matplotlibrc设置文件,是个文本文件,...

2012-04-23 14:46:00 117

转载 rdflib2.4.1安装手记

我用操作系统是winxp sp2第一步:下载并安装python2.5(注:不管我用rdflib2.4.1还是2.4.2 + python2.6 安装是总是有问题,改成了python2.5就可以) 设置环境变量:path中添加:X:\Python25;(X代表安装python2.5时的路径)第二步:下载并安装mingw5.13(下载地址:http://pr...

2012-02-24 13:46:00 509

转载 基于朴素贝叶斯分类器的文本分类算法及其他

朴素贝叶斯应用文本分类的文章,网络上有很多例子。笔者认为比较典型有:洞庭散人先生的文章(http://www.cnblogs.com/phinecos/archive/2008/10/21/1315948.htmljava版);Liang Guo的文章(http://grepk.com/?p=704python版)waemz先生的文章(http://www.cnblogs.c...

2012-02-03 16:26:00 129

转载 Latent Semantic Analysis (LSA) Tutorial 潜语义分析LSA介绍 第三部分 (转载)

Part 4 - Clustering by Color用颜色聚类We can also turnthe numbers into colors. For instance, here is a color display that correspondsto the first 3 dimensions of the Titles matrix that we showed a...

2012-02-02 16:03:00 126

转载 Latent Semantic Analysis (LSA) Tutorial 潜语义分析LSA介绍 第二部分 (转载)

Part 2 - Modify the Counts with TFIDF计算TFIDF替代简单计数In sophisticated Latent Semantic Analysis systems, the raw matrix countsare usually modified so that rare words are weighted more heavily tha...

2012-02-02 15:51:00 114

转载 Latent Semantic Analysis (LSA) Tutorial第一部分(转载)

译:http://www.puffinwarellc.com/index.php/news-and-articles/articles/33.htmlWangBen 2011-09-16 beijing潜语义分析LSA介绍Latent Semantic Analysis (LSA), also known as Latent Semantic Indexi...

2012-02-02 15:47:00 148

转载 基于python的中文分词的实现及应用(转载)

基于python的中文分词的实现及应用刘新亮 严姗姗(北京工商大学计算机学院,100037) 摘 要 中文分词的实现及应用属于自然语言处理范畴,完成的是中文分词在Python语言环境下的实现,以及利用这个实现的一个应用程序接口和一个中文文本处理的应用。设计共分为五个部分,分别是:分词模块、包装模块、应用程序接口、Nonsense模块,这个项目是为了下一步开放源...

2012-02-02 15:20:00 1081

转载 Python中文排序(转载)

Python比较字符串大小时,根据的是ord函数得到的编码值。基于它的排序函数sort可以很容易为数字和英文字母排序,因为它们在编码表中就是顺序排列的。>> print ','< '1'<'A'<'a'<'阿'True但要很处理中文就没那么容易了。中文通常有拼音和笔画两种排序方式,在最常用中文标准字符集GB2312中,3...

2012-02-02 15:19:00 413

转载 用python调用ICTCLAS50进行中文分词

直接上源码吧tokenizer类:#_*_encoding:utf-8_*_from ctypes import *class tokenizer: def __init__(self): self._stext=['、','“','”',',','。','《','》',':',';','!','‘','’','?','?','...

2012-01-07 11:36:00 185

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除