目录 ./ 和 ../ 和 ../..

./ 表示当前目录 …/ 表示父级目录 …/… 表示祖父目录

2019-07-04 08:52:21

阅读数 53

评论数 0

python函数调用参数问题

def example(a, b, c=100): … a = 1 # notice here I am assigning ‘a’ … b = 2 # and here the value of ‘b’ is being overwritten … # The val...

2019-04-09 17:35:27

阅读数 106

评论数 0

python pandas dataframe 数据筛选

import pandas as pd import numpy as np df = pd.DataFrame({‘a’:[1,2,np.nan,np.nan], ‘b’:[4,np.nan,6,np.nan], ‘c’:[np.nan, 8,9,np.nan], ‘d’:[np.nan,np....

2019-04-08 22:29:40

阅读数 104

评论数 0

由字典dictionary或列表list创建dataframe

原文链接

2019-04-05 21:07:13

阅读数 196

评论数 0

sklearn-CountVectorizer

CountVectorizer会将文本中的词语转换为词频矩阵,它通过fit_transform函数计算各个词语出现的次数。 from sklearn.feature_extraction.text import CountVectorizer texts=["dog cat fish&...

2019-04-04 01:54:21

阅读数 39

评论数 0

dataframe常用数据处理

import pandas as pd import numpy as np df = pd.read_csv(r"C:\Users\xx1.csv") dfT = pd.read_csv(r"C:\Users\x...

2019-01-10 19:01:47

阅读数 253

评论数 0

信息熵、联合熵、条件熵、互信息

信息熵、联合熵、条件熵、互信息 1. 自信息量 一个随机事件xxx的自信息量1定义为: I(x)=log⁡1p(x)I(x)=\log\frac{1}{p(x)}I(x)=logp(x)1​ 注意,在信息论中,log⁡\loglog函数的底通常设置为2,此时,自信息量的单位为比特(bit);在机...

2018-12-18 03:24:17

阅读数 1027

评论数 0

anaconda安装第三方包scikit-multiflow

在conda库中没找到scikit-multiflow,在GitHub上下载压缩包,解压到C盘: 第一次安装出错,出现Microsoft Visual C++ 14.0 is required 的错误 c++ 14.0下载地址 https://964279924.ctfile.com/fs/14...

2018-12-16 21:00:09

阅读数 173

评论数 2

vim及linux常用命令

在命令模式下: 单行复制:将光标移动到将要复制的行处,按yy进行复制; 多行复制:将光标移动到将要复制的首行处,按nyy复制n行;其中n为1、2、3…… 粘贴:将光标移动到将要粘贴的行处,按p进行粘贴 显示行号::set nu 移动光标到行尾:$,移动到第n行的行尾n$ 移动光标到...

2018-10-12 16:20:37

阅读数 32

评论数 0

TensorFlow安装与使用

anaconda安装tensorflow python --version: 查看当前python版本,此处为3.6 conda create -n tensorflow python=3.6:新建名为tensorflow的conda环境 source activate tensorfl...

2018-10-12 12:59:08

阅读数 414

评论数 2

csr_matrix的用法--shape, nnz, data, indices, indptr, toarray

from scipy.sparse import csr_matrix arr = np.array([[0,1,0,2,0],[1,1,0,2,0],[2,0,5,0,0]]) b = csr_matrix(arr) #print(b.shape) # (3, 5) #print(b.nnz...

2018-08-03 16:15:02

阅读数 1183

评论数 0

python将字符串list写入excel和txt

docs = [‘icassp improved human face identification using frequency domain representation facial asymmetry’, ‘pattern recognition unsupervised methods...

2018-07-31 11:31:47

阅读数 5200

评论数 0

python用列表生成式写嵌套循环

将两个嵌套for循环写成一个列表生成式 如,有一个嵌套列表,a=[[1,2],[3,4],[5,6]],要提取列表里的每一个元素 用for循环处理: for i in a: for j in i: print(j) 用列表生成式: b=[j for i i...

2018-07-30 15:47:27

阅读数 2557

评论数 1

nltk-提取词干-去除停用词

from nltk.corpus import stopwords Here is the list: set(stopwords.words(‘english’)) {‘ourselves’, ‘hers’, ‘between’, ‘yoursel...

2018-07-30 11:18:37

阅读数 3504

评论数 0

csr_matrix参数解析

压缩稀疏矩阵构造时的参数从官网看不明白,参考如下: indptr = np.array([0, 2, 3, 6]) indices = np.array([0, 2, 2, 0, 1, 2]) data = np.array([1, 2, 3, 4, 5, 6]) csr_matrix((d...

2018-06-28 14:12:00

阅读数 537

评论数 0

vim配置-python版

下载Pydiction插件 mkdir ~/.vim mkdir ~/.vim/bundle cd ~/.vim/bundle git clone https://github.com/rkulla/pydiction.git 配置Pydiction #- UNIX/LINUX/OS...

2018-06-11 14:03:54

阅读数 537

评论数 0

python中read(), readline(), readlines()

我们谈到“文本处理”时,我们通常是指处理的内容。Python 将文本文件的内容读入可以操作的字符串变量非常容易。文件对象提供了三个“读”方法: .read()、.readline() 和 .readlines()。每种方法可以接受一个变量以限制每次读取的数据量,但它们通常不使用变量。 .rea...

2018-06-11 09:34:27

阅读数 207

评论数 0

pandas Series合并add, value_counts

假设se1, se2是series类型, se1 = {computer, circuit, visualization, computer} se1.value_counts() Returns object containing counts of unique values. 也就是...

2018-06-06 18:35:59

阅读数 1618

评论数 0

pandas concat

dfTotal = pd.concat([dfTrain, dfTest], axis = 0).fillna('') 由于第一列‘name’比其他列长,pandas自动将‘name’列放在了最后一列,如果不想更改列的顺序,需要加入sort = False 即 dfTotal = pd....

2018-06-06 16:50:24

阅读数 393

评论数 0

Pandas中DateFrame修改列名

import pandas as pd a = pd.DataFrame({'A':[1,2,3], 'B':[4,5,6], 'C':[7,8,9]}) a A B C 0 1 4 7 1 2 5 8 2 3 6 9 方法一:暴力方法(bmm: 实践中只有此方法有...

2018-06-06 16:46:57

阅读数 261

评论数 0

提示
确定要删除当前文章?
取消 删除