- 博客(16)
- 资源 (39)
- 收藏
- 关注
原创 python读文件或文件夹计算idf
#-*- encoding:utf-8 -*-import osimport jiebaimport jieba.analyseimport jsonimport codecsimport mathimport sysreload(sys)sys.setdefaultencoding('utf8')'''''读取文件,文件每行是一个文档计算得到idf文件求idf得步骤:
2017-01-17 16:38:43 1002
原创 office2010粘贴无法使用
在安装了MathType后,MathType会和Office产生冲突解决方法:将MathType安装目录下的 MathType Commands 6 For Word.dotm 和 MathPage.wll 拷贝到office安装目录的D:\Program Files (x86)\Microsoft Office\Office14\STARTUP目录下
2017-01-14 20:49:14 2934
原创 python提取文本中的中文
# -*- coding: utf-8 -*-import reimport sysreload(sys)sys.setdefaultencoding("utf8")def translate(str): line = str.strip().decode('utf-8', 'ignore') # 处理前进行相关的处理,包括转换成Unicode等 p2 = re.co
2017-01-14 16:57:13 20680
原创 windows下pip安装python模块时报错总结
前言: 这几天把python版本升级后,发现pip安装模块好多都报错(暂不确定是不是因为升级导致的),我定睛一看,发现是权限的问题,那么怎么解决呢?1 权限问题C:\Users\ljf>pip install xlwtException:Traceback (most recent call last): File "c:\program files\
2017-01-12 18:05:29 4325
原创 mysql导入大量数据
load data local infile 'D:\\ttt.txt' into table t_weibo_big FIELDS TERMINATED BY '\t';
2017-01-12 14:59:21 448
原创 java正则点匹配到换行符
private static List getStrings(String str) { String reg2 = ""; Pattern p = Pattern.compile(reg2, Pattern.CASE_INSENSITIVE | Pattern.DOTALL); Matcher m = p.matcher(str); Array
2017-01-12 11:43:41 3748
转载 基于互信息和左右信息熵的短语提取识别
原文地址在中文语言处理领域,一项重要的任务就是提取中文短语,也即固定多字词表达串的识别。短语提取经常用于搜索引擎的自动推荐,新词识别等领域。本文主要实现了从陌生文本中自动发现固定短语,并给出原理和步骤。开源项目本文代码已集成到HanLP中开源:http://www.hankcs.com/nlp/hanlp.html测试数据算法工程师算法(Al
2017-01-11 19:49:24 1362
原创 python读取数据库
python2.x和3.x都可以使用pymysql(3.x不支持MySQLdb)安装pymysql: pip install pymysql# -*- coding: utf-8 -*-import pymysqltry:#获取一个数据库连接,注意如果是UTF-8类型的,需要制定数据库 conn=pymysql.connect(host='localhost',
2017-01-08 18:09:15 2260
原创 gensim计算词相似度报错
Traceback (most recent call last): File "D:/dev_src/python/image_classifiy/text/similarity.py", line 34, in run() File "D:/dev_src/python/image_classifiy/text/similarity.py", line 16, in r
2017-01-05 17:18:10 1845
原创 KeyError: u'\xe5\x9b\xbd\xe5\xae\xb6'
字符串不加u报错 KeyError: u'\xe5\x9b\xbd\xe5\xae\xb6'表示使用unicode编码或者使用img_tags.decode("utf-8")将对应编码解码成unicode
2017-01-04 22:41:06 4859
原创 元组排序
首先这是一个由元组组成的列表,可以直接排序>>> s=[('the', 5), ('of', 4), ('a', 3), ('people', 2), ('is', 2), ('when', 2), ('beating', 2) ]>>> s.sort(key=lambda x:(x[1],x[0]))>>> s[('beating', 2), ('is', 2), ('peopl
2017-01-04 21:36:35 812
原创 python中sklearn-learn模型持久化
pkfile = open("classify_img.pkl", 'ab')pickle.dump(clf, pkfile)pkfile.close()pkfile2 = open("classify_img.pkl", 'rb')clf = pickle.load(pkfile2)from sklearn.externals import joblibjoblib.dump
2017-01-04 19:55:03 1308
转载 给numpy矩阵添加一列
首先我们有一个数据是一个mn的numpy矩阵现在我们希望能够进行给他加上一列变成一个m(n+1)的矩阵import numpy as npa = np.array([[1,2,3],[4,5,6],[7,8,9]])b = np.ones(3)c = np.array([[1,2,3,1],[4,5,6,1],[7,8,9,1]])PRint(a)print(b)print(c)
2017-01-03 20:05:10 24204 1
FatJardbgj.zip
2015-02-03
commons-dbcp-1.4和commons-pool-1.6驱动包下载(亲测可用)
2014-02-17
聚类测试数据
2016-08-15
ibernate3.x必须的包
2015-06-07
HibernateDemo
2015-06-07
hibernate3.2_core.rar
2015-06-06
jdic 64位的
2015-05-25
slf4j-api-1.6.4.jar
2015-04-25
commons-logging-1.2.jar下载
2015-04-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人