2017年01月_Yan456jie

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月 02月 01月

原创 python读文件或文件夹计算idf

#-*- encoding:utf-8 -*-import osimport jiebaimport jieba.analyseimport jsonimport codecsimport mathimport sysreload(sys)sys.setdefaultencoding('utf8')'''''读取文件，文件每行是一个文档计算得到idf文件求idf得步骤：

2017-01-17 16:38:43 1002

原创 office2010粘贴无法使用

在安装了MathType后，MathType会和Office产生冲突解决方法：将MathType安装目录下的 MathType Commands 6 For Word.dotm 和 MathPage.wll 拷贝到office安装目录的D:\Program Files (x86)\Microsoft Office\Office14\STARTUP目录下

2017-01-14 20:49:14 2934

原创 python提取文本中的中文

# -*- coding: utf-8 -*-import reimport sysreload(sys)sys.setdefaultencoding("utf8")def translate(str): line = str.strip().decode('utf-8', 'ignore') # 处理前进行相关的处理，包括转换成Unicode等 p2 = re.co

2017-01-14 16:57:13 20680

原创 windows下pip安装python模块时报错总结

前言：　　　这几天把python版本升级后，发现pip安装模块好多都报错（暂不确定是不是因为升级导致的），我定睛一看，发现是权限的问题，那么怎么解决呢？1 权限问题C:\Users\ljf>pip install xlwtException:Traceback (most recent call last): File "c:\program files\

2017-01-12 18:05:29 4325

原创 mysql导入大量数据

load data local infile 'D:\\ttt.txt' into table t_weibo_big FIELDS TERMINATED BY '\t';

2017-01-12 14:59:21 448

原创 java正则点匹配到换行符

private static List getStrings(String str) { String reg2 = ""; Pattern p = Pattern.compile(reg2, Pattern.CASE_INSENSITIVE | Pattern.DOTALL); Matcher m = p.matcher(str); Array

2017-01-12 11:43:41 3748

原创语义分析工具

中科院http://ictclas.nlpir.org/nlpir/哈工大http://www.ltp-cloud.com/

2017-01-12 09:53:20 5980

原创计算句子相似度

1、使用vsm向量空间模型2、将词使用word2vec将词转换成向量，计算两个句子向量分布距离，使用kl散度

2017-01-11 20:50:14 1579

转载基于互信息和左右信息熵的短语提取识别

原文地址在中文语言处理领域，一项重要的任务就是提取中文短语，也即固定多字词表达串的识别。短语提取经常用于搜索引擎的自动推荐，新词识别等领域。本文主要实现了从陌生文本中自动发现固定短语，并给出原理和步骤。开源项目本文代码已集成到HanLP中开源：http://www.hankcs.com/nlp/hanlp.html测试数据算法工程师算法（Al

2017-01-11 19:49:24 1362

原创 python读取数据库

python2.x和3.x都可以使用pymysql（3.x不支持MySQLdb）安装pymysql: pip install pymysql# -*- coding: utf-8 -*-import pymysqltry:#获取一个数据库连接，注意如果是UTF-8类型的，需要制定数据库 conn=pymysql.connect(host='localhost',

2017-01-08 18:09:15 2260

原创 gensim计算词相似度报错

Traceback (most recent call last): File "D:/dev_src/python/image_classifiy/text/similarity.py", line 34, in run() File "D:/dev_src/python/image_classifiy/text/similarity.py", line 16, in r

2017-01-05 17:18:10 1845

原创 KeyError: u'\xe5\x9b\xbd\xe5\xae\xb6'

字符串不加u报错 KeyError: u'\xe5\x9b\xbd\xe5\xae\xb6'表示使用unicode编码或者使用img_tags.decode("utf-8")将对应编码解码成unicode

2017-01-04 22:41:06 4859

原创元组排序

首先这是一个由元组组成的列表，可以直接排序>>> s=[('the', 5), ('of', 4), ('a', 3), ('people', 2), ('is', 2), ('when', 2), ('beating', 2) ]>>> s.sort(key=lambda x:(x[1],x[0]))>>> s[('beating', 2), ('is', 2), ('peopl

2017-01-04 21:36:35 812

原创 python中sklearn-learn模型持久化

pkfile = open("classify_img.pkl", 'ab')pickle.dump(clf, pkfile)pkfile.close()pkfile2 = open("classify_img.pkl", 'rb')clf = pickle.load(pkfile2)from sklearn.externals import joblibjoblib.dump

2017-01-04 19:55:03 1308

原创 python生成1行四列全2矩阵

print np.ones((1,4))*2

2017-01-03 20:09:04 15073

转载给numpy矩阵添加一列

首先我们有一个数据是一个mn的numpy矩阵现在我们希望能够进行给他加上一列变成一个m(n+1)的矩阵import numpy as npa = np.array([[1,2,3],[4,5,6],[7,8,9]])b = np.ones(3)c = np.array([[1,2,3,1],[4,5,6,1],[7,8,9,1]])PRint(a)print(b)print(c)

2017-01-03 20:05:10 24204 1

commons-io-2.4.jar

Commons项目中用来处理IO的一些工具类包。很多项目都有用到commons io

2015-04-25

vimcdoc 中文帮助文档

vimcdoc vim vi 注意需放置到vim74下中文帮助文档亲测可用

2015-02-07

FatJardbgj.zip

fat eclipse插件打包jar 最好用link方法安装，用原生的eclipse，有的ee(集成了javaee各种技术的)版本安装不上，se版本都可以

2015-02-03

slf4j-1.5.6.tar.zip

SLF4J是一个用于日志系统的简单Facade，很有用，可以直接用作输出记录文件

2015-02-03

commons-lang3-3.3.2.jar

commons-lang java常用方法集合 apache上面的一个项目，封装了一些常用的java方法，提高开发效率

2015-02-03

gson-2.3.jar

json gson json处理 java包 google根据json规范开发的一个包，很好用

2015-02-03

jsoup-1.7.3.jar

jsoup jar包 html解析很好的html解析工具，学习好以后很容易从网上爬取数据

2015-02-03

dom4j-1.6.1.jar xml解析工具包 java

dom4j-1.6.1.jar xml解析工具包 java,导入即可使用，网上有很多方法

2015-02-03

PyDev eclipse上使用python的插件

PyDev eclipse上使用python的插件，安装方法网上很多，最好选用Link方式的

2015-02-03

Matplotlib-1.4.0 chm格式帮助文档

Matplotlib-1.4.0 chm格式帮助文档，如若打开空白，请将属性解锁。选中文档，右键，属性，解除锁定

2015-02-03

sublime text 3破解工具

解压后放入sublime text 3根文件夹，点击保存，提示成功即可。经测试3065版本可行

2015-01-31

commons-dbcp-1.4和commons-pool-1.6驱动包下载（亲测可用）

2014-02-17

mmseg4j-1.8.5 分词压缩包

mmseg4j-1.8.5 分词压缩包mmseg4j-1.8.5 分词压缩包

2017-03-05

图像分类数据

数据为从101_ObjectCategories中选出的部分数据，作为图像分类的测试数据

2016-08-26

聚类测试数据

two_cluster、three_cluster、five_cluster为不同簇数的点集，适用于Kmeans聚类 spiral、Twomoons、ThreeCircles分别为螺旋分布、月牙分布、环形分布数据集。

2016-08-15

重新编译的hadoop-core-1.0.2.jar

Hadoop Failed to set permissions of path 错误处理替换包

2016-04-07

谢菲尔德大学matlab遗传算法工具包

谢菲尔德大学matlab遗传算法工具包，导入matlab即可用

2015-07-27

ibernate3.x必须的包

ibernate3.x必须的包,具体参见 http://blog.csdn.net/yan456jie/article/details/46392765

2015-06-07

HibernateDemo

Hibernate入门小例子（自带jar包），需安装好mysql设置root密码为123456 并建立名为hibernate的数据库，这些在配置文件中可以看到

2015-06-07

hibernate3.2_core.rar

hibernate3.x所需的核心包，注意：不包含数据库驱动包mysql-connector-java-5.1.29-bin.jar，注释包，hql语言解释包等，具体参见http://blog.csdn.net/yan456jie/article/details/46392765

2015-06-06

jdic 64位的

jdic目前提供了本机 Web 浏览器（Internet Explorer 或 Mozilla）支持、系统托盘支持、文件扩展集成、应用程序启动与打印和其他桌面特性。

2015-05-25

mentohust_0.3.4-1_i386.deb

mentohust_0.3.4-1_i386.deb 32位 ubuntu系统用的

2015-05-20

slf4j-api-1.6.4.jar

简单日记门面(simple logging Facade for java)SLF4J是为各种loging APIs提供一个简单统一的接口，从而使得最终用户能够在部署的时候配置自己希望的loging APIs实现。

2015-04-25

junit-4.1.jar

junit-4.1.jar 测试包junit-4.1.jar

2015-04-25

commons-logging-1.2.jar commons封装的日志包。commons-logging.jar包是使用spring的必备包。本包为服务器端程序的日志处理提供API以使用多种不同的日志系统。果你希望你的日志记录与实现无关，你可以使用Apache Commons Logging，它使用抽象的API,这些API都是实现无关的，可以让你在不同的日志记录实现之间切换，而不需要修改你的代码。

2015-04-25

commons-collections-3.2.1

commons-collections-3.2.1 封装了好用的集合，是对基础集合的扩展

2015-04-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

commons-io-2.4.jar

vimcdoc 中文帮助文档

FatJardbgj.zip

slf4j-1.5.6.tar.zip

commons-lang3-3.3.2.jar

gson-2.3.jar

jsoup-1.7.3.jar

libsvm-3.20.zip

dom4j-1.6.1.jar xml解析工具包 java

PyDev eclipse上使用python的插件

Matplotlib-1.4.0 chm格式帮助文档

sublime text 3破解工具

android+api+教程

数据结构考研试题1800题集锦（含答案）

21天学通C++ 带书签 清晰

commons-dbcp-1.4和commons-pool-1.6驱动包下载（亲测可用）

java连接mysql的驱动包（包含源码文档等，亲测可用）

java实用课件教程.rar

1990-2010软件设计师真题及答案.zip

mmseg4j-1.8.5 分词压缩包

图像分类数据

聚类测试数据

hadoop-eclipse-plugin-1.2.1

重新编译的hadoop-core-1.0.2.jar

谢菲尔德大学matlab遗传算法工具包

hibernate验证文件

ibernate3.x必须的包

HibernateDemo

hibernate3.2_core.rar

jdic 64位的

mentohust_0.3.4-1_i386.deb

json.jar 包

slf4j-api-1.6.4.jar

log4j-1.2.17.jar

spring-2.5.jar

junit-4.1.jar

commons-logging-1.2.jar下载

commons-collections-3.2.1

空空如也

21天学通C++ 带书签清晰