- 博客(11)
- 资源 (3)
- 收藏
- 关注
原创 pandas read_csv 错误: pandas.parser.CParserError: Error tokenizing data. C error
今天panda.read_csv时遇到以下错误: File "/root/anaconda2/lib/python2.7/site-packages/pandas/io/parsers.py", line 1213, in read data = self._reader.read(nrows) File "pandas/parser.pyx", line 766, in pandas
2017-03-31 19:16:51 25211
原创 jieba提取关键词时筛选词性时单词性选择的一点注意事项
最近又在迭代特征工程,发现jieba提取特征词有个需要注意的地方,直接看例子例子1>>> import jieba>>> import jieba.posseg as pseg>>> s = '我们喜欢支付宝, 苹果'>>> ws = pseg.cut(s)>>> for i in ws:... print i...我们/r喜欢/v支付宝/nr,/x /x苹果/n>
2017-03-31 17:46:23 10332
原创 哈工大ltp词性标注列表和ICTCLAS词性列表
哈工大ltp词性列表Tag Description Examplea adjective 美丽 b other noun-modifier 大型, 西式 c conjunction 和, 虽然 d adverb 很 e exclamation 哎 g morpheme 茨, 甥 h prefix 阿, 伪 i
2017-03-30 11:50:35 10319
原创 语素、词性列表及jieba与哈工大pyltp一个例子对比
1 关于语素百度百科的解释: 语法单位有大有小,最大的语法单位是句子,比句子小的语法单位,依次是短语、词、语素。人类的语言是有声音、有意义的,是语音和语义的结合体,这便是语法单位基本的特点。语素是最小的语法单位,也就是最小的语音、语义结合体。 所有我的理解是,分词后的各个词都是语素。语素有名词性语素、动词性语素等类别。2 ICTCLAS 词性列表注: ICTCLAS——中国科学
2017-03-30 11:19:30 4455
原创 pandas DataFrame操作
pandas 处理格式化数据的利器。 本文会不断更新1. DataFram1.1 使用字典构造>>> import pandas as pd>>> d = {'doc':['txt1'], 'nid':[100]}>>> df = pd.DataFrame(data=d, columns=('nid', 'doc'))>>> df nid doc0 100 txt1>>>
2017-03-29 18:10:20 4010
原创 python Manager对象增加进程
问题:启动一个python进程,ps发现还有多个额外进程 说明: 一个multiprocessing.Manager对象会控制一个服务器进程,其他进程可以通过代理的方式来访问这个服务器进程。举例: test_manager.py :from multiprocessing import Managerimport timem1 = Manager()m2 = Manage
2017-03-16 17:05:22 1462
原创 python format 在sql中对 string 和 int 类型的变化
今天在使用format拼sql语句时遇到一下问题:>>> s = '12345'>>> q0 = "select nid from news_simhash where first_16={0}">>> q1 = "select nid from news_simhash where first_16='{0}'">>> from doc_process import get_postgred
2017-03-16 12:17:05 1527
原创 linux redhat7 升级NVIDIA显卡驱动步骤
1 背景前面在redhat7服务器上升级了tensorflow1.0,发现GPU用不了 根据教程,测试GPU:# 新建一个 graph.import tensorflow as tfa = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[2, 3], name='a')b = tf.constant([1.0, 2.0, 3.0, 4.
2017-03-11 11:02:50 10248
原创 阿里云HPC升级 tensorfow 1.0之cuda、cudnn、glibc、libcxx
昨天开始升级hpc的tensorflow,中间踩了个大坑。到现在才弄顺,mark一下。gpu版的tf,可以在github上下载,然后按照教程使用pip安装。但需要更新很多系统包升级cuda 8 及cudnn8到官网下载 https://developer.nvidia.com/cuda-downloads 按照教程直接安装就可以。 2.下载cudnn5.1 https://develope
2017-03-08 00:50:09 1015
原创 人工神经网络(ANN)及BP算法
1 什么是神经网络1.1 基本结构 说明:通常一个神经网络由一个input layer,多个hidden layer和一个output layer构成。图中圆圈可以视为一个神经元(又可以称为感知器)设计神经网络的重要工作是设计hidden layer,及神经元之间的权重添加少量隐层获得浅层神经网络SNN;隐层很多时就是深层神经网络DNN1.2 从逻辑回归到神经元LinearRegres
2017-03-05 09:53:36 134206 21
原创 从sklearn.preprocessing, sklearn.feature_selection学习特征工程之预处理
基本特征工程基本框架如下图。 本文借助sklearn介绍其中的预处理部分二 单特征预处理 标准化 Standardization 或者叫 mean removal and variance scaling(平均值移除、方差缩放) 说明1: 标准化其实就是干两件事:“transform the data to center” ,即
2017-03-03 00:42:06 798
LINDO 7.0 API
2012-08-16
LINDO 7.0 API
2012-08-16
LINDO API 7.0
2012-08-16
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人