自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 资源 (39)
  • 收藏
  • 关注

原创 python读文件或文件夹计算idf

#-*- encoding:utf-8 -*-import osimport jiebaimport jieba.analyseimport jsonimport codecsimport mathimport sysreload(sys)sys.setdefaultencoding('utf8')'''''读取文件,文件每行是一个文档计算得到idf文件求idf得步骤:

2017-01-17 16:38:43 1002

原创 office2010粘贴无法使用

在安装了MathType后,MathType会和Office产生冲突解决方法:将MathType安装目录下的  MathType Commands 6 For Word.dotm  和  MathPage.wll  拷贝到office安装目录的D:\Program Files (x86)\Microsoft Office\Office14\STARTUP目录下

2017-01-14 20:49:14 2934

原创 python提取文本中的中文

# -*- coding: utf-8 -*-import reimport sysreload(sys)sys.setdefaultencoding("utf8")def translate(str): line = str.strip().decode('utf-8', 'ignore') # 处理前进行相关的处理,包括转换成Unicode等 p2 = re.co

2017-01-14 16:57:13 20680

原创 windows下pip安装python模块时报错总结

前言:   这几天把python版本升级后,发现pip安装模块好多都报错(暂不确定是不是因为升级导致的),我定睛一看,发现是权限的问题,那么怎么解决呢?1 权限问题C:\Users\ljf>pip install xlwtException:Traceback (most recent call last): File "c:\program files\

2017-01-12 18:05:29 4325

原创 mysql导入大量数据

load data local infile 'D:\\ttt.txt' into table t_weibo_big FIELDS TERMINATED BY '\t';

2017-01-12 14:59:21 448

原创 java正则点匹配到换行符

private static List getStrings(String str) { String reg2 = ""; Pattern p = Pattern.compile(reg2, Pattern.CASE_INSENSITIVE | Pattern.DOTALL); Matcher m = p.matcher(str); Array

2017-01-12 11:43:41 3748

原创 语义分析工具

中科院http://ictclas.nlpir.org/nlpir/哈工大http://www.ltp-cloud.com/

2017-01-12 09:53:20 5980

原创 计算句子相似度

1、使用vsm向量空间模型2、将词使用word2vec将词转换成向量,计算两个句子向量分布距离,使用kl散度

2017-01-11 20:50:14 1579

转载 基于互信息和左右信息熵的短语提取识别

原文地址在中文语言处理领域,一项重要的任务就是提取中文短语,也即固定多字词表达串的识别。短语提取经常用于搜索引擎的自动推荐,新词识别等领域。本文主要实现了从陌生文本中自动发现固定短语,并给出原理和步骤。开源项目本文代码已集成到HanLP中开源:http://www.hankcs.com/nlp/hanlp.html测试数据算法工程师算法(Al

2017-01-11 19:49:24 1362

原创 python读取数据库

python2.x和3.x都可以使用pymysql(3.x不支持MySQLdb)安装pymysql:  pip install pymysql# -*- coding: utf-8 -*-import pymysqltry:#获取一个数据库连接,注意如果是UTF-8类型的,需要制定数据库 conn=pymysql.connect(host='localhost',

2017-01-08 18:09:15 2260

原创 gensim计算词相似度报错

Traceback (most recent call last):  File "D:/dev_src/python/image_classifiy/text/similarity.py", line 34, in     run()  File "D:/dev_src/python/image_classifiy/text/similarity.py", line 16, in r

2017-01-05 17:18:10 1845

原创 KeyError: u'\xe5\x9b\xbd\xe5\xae\xb6'

字符串不加u报错 KeyError: u'\xe5\x9b\xbd\xe5\xae\xb6'表示使用unicode编码或者使用img_tags.decode("utf-8")将对应编码解码成unicode

2017-01-04 22:41:06 4859

原创 元组排序

首先这是一个由元组组成的列表,可以直接排序>>> s=[('the', 5), ('of', 4), ('a', 3), ('people', 2), ('is', 2), ('when', 2), ('beating', 2) ]>>> s.sort(key=lambda x:(x[1],x[0]))>>> s[('beating', 2), ('is', 2), ('peopl

2017-01-04 21:36:35 812

原创 python中sklearn-learn模型持久化

pkfile = open("classify_img.pkl", 'ab')pickle.dump(clf, pkfile)pkfile.close()pkfile2 = open("classify_img.pkl", 'rb')clf = pickle.load(pkfile2)from sklearn.externals import joblibjoblib.dump

2017-01-04 19:55:03 1308

原创 python生成1行四列全2矩阵

print np.ones((1,4))*2

2017-01-03 20:09:04 15073

转载 给numpy矩阵添加一列

首先我们有一个数据是一个mn的numpy矩阵现在我们希望能够进行给他加上一列变成一个m(n+1)的矩阵import numpy as npa = np.array([[1,2,3],[4,5,6],[7,8,9]])b = np.ones(3)c = np.array([[1,2,3,1],[4,5,6,1],[7,8,9,1]])PRint(a)print(b)print(c)

2017-01-03 20:05:10 24204 1

commons-io-2.4.jar

Commons项目中用来处理IO的一些工具类包。很多项目都有用到commons io

2015-04-25

vimcdoc 中文帮助文档

vimcdoc vim vi 注意需放置到vim74下 中文帮助文档 亲测可用

2015-02-07

FatJardbgj.zip

fat eclipse插件 打包jar 最好用link方法安装,用原生的eclipse,有的ee(集成了javaee各种技术的)版本安装不上,se版本都可以

2015-02-03

slf4j-1.5.6.tar.zip

SLF4J是一个用于日志系统的简单Facade,很有用,可以直接用作输出记录文件

2015-02-03

commons-lang3-3.3.2.jar

commons-lang java常用方法集合 apache上面的一个项目,封装了一些常用的java方法,提高开发效率

2015-02-03

gson-2.3.jar

json gson json处理 java包 google根据json规范开发的一个包,很好用

2015-02-03

jsoup-1.7.3.jar

jsoup jar包 html解析 很好的html解析工具,学习好以后很容易从网上爬取数据

2015-02-03

libsvm-3.20.zip

机器学习 libsvm svm 支持向量机 参考网上教程使用

2015-02-03

dom4j-1.6.1.jar xml解析工具包 java

dom4j-1.6.1.jar xml解析工具包 java,导入即可使用,网上有很多方法

2015-02-03

PyDev eclipse上使用python的插件

PyDev eclipse上使用python的插件,安装方法网上很多,最好选用Link方式的

2015-02-03

Matplotlib-1.4.0 chm格式帮助文档

Matplotlib-1.4.0 chm格式帮助文档,如若打开空白,请将属性解锁。选中文档,右键,属性,解除锁定

2015-02-03

sublime text 3破解工具

解压后放入sublime text 3根文件夹,点击保存,提示成功即可。经测试3065版本可行

2015-01-31

android+api+教程

android+api+教程

2014-06-16

数据结构考研试题1800题集锦(含答案)

数据结构考研试题1800题集锦(含答案)

2014-06-16

21天学通C++ 带书签 清晰

21天学通C++ 带书签 清晰 英文好的朋友可以看看

2014-05-10

commons-dbcp-1.4和commons-pool-1.6驱动包下载(亲测可用)

commons-dbcp-1.4和commons-pool-1.6驱动包下载(亲测可用)

2014-02-17

java连接mysql的驱动包(包含源码文档等,亲测可用)

java连接mysql的驱动包(包含源码文档等,亲测可用)

2014-02-17

java实用课件教程.rar

比较全的java的课件教程ppt欢迎下载

2012-09-30

1990-2010软件设计师真题及答案.zip

1990-2010软件设计师真题及答案.zip

2012-09-30

mmseg4j-1.8.5 分词压缩包

mmseg4j-1.8.5 分词压缩包mmseg4j-1.8.5 分词压缩包

2017-03-05

图像分类数据

数据为从101_ObjectCategories中选出的部分数据,作为图像分类的测试数据

2016-08-26

聚类测试数据

two_cluster、three_cluster、five_cluster为不同簇数的点集,适用于Kmeans聚类 spiral、Twomoons、ThreeCircles分别为螺旋分布、月牙分布、环形分布数据集。

2016-08-15

hadoop-eclipse-plugin-1.2.1

eclipse3.6 hadoop插件

2016-04-07

重新编译的hadoop-core-1.0.2.jar

Hadoop Failed to set permissions of path 错误处理替换包

2016-04-07

谢菲尔德大学matlab遗传算法工具包

谢菲尔德大学matlab遗传算法工具包,导入matlab即可用

2015-07-27

hibernate验证文件

hibernate验证文件,验证xml的dtd文件

2015-06-14

ibernate3.x必须的包

ibernate3.x必须的包,具体参见 http://blog.csdn.net/yan456jie/article/details/46392765

2015-06-07

HibernateDemo

Hibernate入门小例子(自带jar包),需安装好mysql设置root密码为123456 并建立名为hibernate的数据库,这些在配置文件中可以看到

2015-06-07

hibernate3.2_core.rar

hibernate3.x所需的核心包,注意:不包含数据库驱动包mysql-connector-java-5.1.29-bin.jar,注释包,hql语言解释包等,具体参见http://blog.csdn.net/yan456jie/article/details/46392765

2015-06-06

jdic 64位的

jdic目前提供了本机 Web 浏览器(Internet Explorer 或 Mozilla) 支持、系统托盘支持、文件扩展集成、应用程序启动与打印和其他桌面特性。

2015-05-25

mentohust_0.3.4-1_i386.deb

mentohust_0.3.4-1_i386.deb 32位 ubuntu系统用的

2015-05-20

json.jar 包

json.jar 解析json的包 j

2015-04-25

slf4j-api-1.6.4.jar

简单日记门面(simple logging Facade for java)SLF4J是为各种loging APIs提供一个简单统一的 接口,从而使得最终用户能够在部署的时候配置自己希望的loging APIs实现。

2015-04-25

log4j-1.2.17.jar

log4j-1.2.17.jar 非常常用的日志包

2015-04-25

spring-2.5.jar

spring-2.5.jar spring旧版本的核心包

2015-04-25

junit-4.1.jar

junit-4.1.jar 测试包junit-4.1.jar

2015-04-25

commons-logging-1.2.jar下载

commons-logging-1.2.jar commons封装的日志包。commons-logging.jar包是使用spring的必备包。本包为服务器端程序的日志处理提供API以使用多种不同的日志系统。果你希望你的日志记录与实现无关,你可以使用Apache Commons Logging,它使用抽象的API,这些API都是实现无关的,可以让你在不同的日志记录实现之间切换,而不需要修改你的代码。

2015-04-25

commons-collections-3.2.1

commons-collections-3.2.1 封装了好用的集合,是对基础集合的扩展

2015-04-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除