![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
文章平均质量分 51
bymaymay
不念过去,不惧未来!
展开
-
Python中strip和split的使用
strip:参数为空时,默认删除开头和结尾处的空白符,包括’\n’,’\r’,’\t’ split:按字符串(单个字符)全部分割ipaddrX = "xx173.10.1.101 \t\n"ipaddrX.strip('x') #删除字符串ipaddr中开头和结尾处的x'173.10.1.101 \t\n'ipaddrX.strip('x').strip() #strip的参数为空时,默认删除原创 2017-10-25 08:54:09 · 959 阅读 · 0 评论 -
python用列表生成式写嵌套循环
将两个嵌套for循环写成一个列表生成式 如,有一个嵌套列表,a=[[1,2],[3,4],[5,6]],要提取列表里的每一个元素用for循环处理:for i in a: for j in i: print(j)用列表生成式:b=[j for i in a for j in i]#注意两个for的顺序print(b) b=[1, 2, 3,...转载 2018-07-30 15:47:27 · 12562 阅读 · 1 评论 -
python将字符串list写入excel和txt
docs = [‘icassp improved human face identification using frequency domain representation facial asymmetry’, ‘pattern recognition unsupervised methods classification hyperspectral images low spatial re...原创 2018-07-31 11:31:47 · 17692 阅读 · 0 评论 -
dataframe常用数据处理
import pandas as pdimport numpy as npdf = pd.read_csv(r"C:\Users\xx1.csv")dfT = pd.read_csv(r"C:\Users\xx2.csv")df1 = df.loc[:,['column1','column2']] #取给定两列的所有行df1['label'] = int(0)df2 = dfT.loc...原创 2019-01-10 19:01:47 · 985 阅读 · 0 评论 -
sklearn-CountVectorizer
CountVectorizer会将文本中的词语转换为词频矩阵,它通过fit_transform函数计算各个词语出现的次数。from sklearn.feature_extraction.text import CountVectorizertexts=["dog cat fish","dog cat cat","fish bird", 'bird'] # “dog cat fish” 为输入...转载 2019-04-04 01:54:21 · 370 阅读 · 0 评论 -
由字典dictionary或列表list创建dataframe
原文链接转载 2019-04-05 21:07:13 · 4390 阅读 · 0 评论 -
python pandas dataframe 数据筛选
import pandas as pdimport numpy as npdf = pd.DataFrame({‘a’:[1,2,np.nan,np.nan], ‘b’:[4,np.nan,6,np.nan], ‘c’:[np.nan, 8,9,np.nan], ‘d’:[np.nan,np.nan,np.nan,np.nan]})print (df.notnull().any(axis =...转载 2019-04-08 22:29:40 · 1443 阅读 · 0 评论 -
python函数调用参数问题
def example(a, b, c=100):… a = 1 # notice here I am assigning ‘a’… b = 2 # and here the value of ‘b’ is being overwritten… # The value of c is set to 100 by default… print(a,b,c)...转载 2019-04-09 17:35:27 · 611 阅读 · 0 评论 -
csr_matrix的用法--shape, nnz, data, indices, indptr, toarray
from scipy.sparse import csr_matrixarr = np.array([[0,1,0,2,0],[1,1,0,2,0],[2,0,5,0,0]])b = csr_matrix(arr)#print(b.shape) # (3, 5)#print(b.nnz) #非零个数, 7print(b.data) #非零值, [1 2 1 1 2 2 5]pri...转载 2018-08-03 16:15:02 · 6189 阅读 · 0 评论 -
csr_matrix参数解析
压缩稀疏矩阵构造时的参数从官网看不明白,参考如下:indptr = np.array([0, 2, 3, 6])indices = np.array([0, 2, 2, 0, 1, 2])data = np.array([1, 2, 3, 4, 5, 6])csr_matrix((data, indices, indptr), shape=(3, 3)).toarray()a...原创 2018-06-28 14:12:00 · 7353 阅读 · 2 评论 -
python中read(), readline(), readlines()
我们谈到“文本处理”时,我们通常是指处理的内容。Python 将文本文件的内容读入可以操作的字符串变量非常容易。文件对象提供了三个“读”方法: .read()、.readline() 和 .readlines()。每种方法可以接受一个变量以限制每次读取的数据量,但它们通常不使用变量。 .read() 每次读取整个文件,它通常用于将文件内容放到一个字符串变量中。然而 .read() 生成文件内容...转载 2018-06-11 09:34:27 · 604 阅读 · 0 评论 -
Python中matplotlib画图
散点图scatterimport numpy as npimport matplotlib.pyplot as plt#data = np.loadtxt('/home/bymaymay/data1.txt', delimiter=',') #data1.txt中数据格式,例:34,78,0data = np.array([[3,7,0],[3,4,0],[6,8,1],[7,7,1]])x原创 2017-09-01 18:14:10 · 420 阅读 · 0 评论 -
Numpy常用函数sum, shape, reshape, argsort, tile,where
sum函数shape函数argsort函数tile函数转载请附上:原文链接sum函数import numpy as np #导入numpy模块,将np作为其别名a=np.array([[0,1,2],[2,1,3]])np.sum(a) #将矩阵的所有元素相加,结果为:9np.sum(a,axis=0) #将矩阵a的每一列相加,结果为:array([2,2,5])np.sum(a,a原创 2017-08-22 10:59:13 · 812 阅读 · 0 评论 -
vim配置-python版
下载Pydiction插件mkdir ~/.vimmkdir ~/.vim/bundlecd ~/.vim/bundlegit clone https://github.com/rkulla/pydiction.git配置Pydiction#- UNIX/LINUX/OSX: Put python_pydiction.vim in ~/.vim/after/ftplugi...原创 2018-06-11 14:03:54 · 937 阅读 · 0 评论 -
gensim中文教程-及-NLTK, SKLEARN, GENSIM的区别
https://blog.csdn.net/duinodu/article/details/76618638转载 2018-06-04 17:40:01 · 2803 阅读 · 0 评论 -
[python] global 和nonlocal
在Python中,当引用一个变量的时候,对这个变量的搜索是按找本地作用域(Local)、嵌套作用域(Enclosing function locals)、全局作用域(Global)、内置作用域(builtins模块)的顺序来进行的,即所谓的LEGB规则。 然而当在一个函数内部为一个变量赋值时,并不是按照上面所说LEGB规则来首先找到变量,之后为该变量赋值。在Python中,在函数中为一个变量赋...转载 2018-06-05 09:57:10 · 143 阅读 · 0 评论 -
Pandas——ix vs loc vs iloc区别
loc——通过行标签索引行数据1.1 loc[1]表示索引的是第1行(index 是整数)import pandas as pd data = [[1,2,3],[4,5,6]] index = [0,1] columns=['a','b','c'] df = pd.DataFrame(data=data, index=index, columns=columns) ...原创 2018-06-05 13:55:08 · 387 阅读 · 0 评论 -
Pandas中DateFrame修改列名
import pandas as pda = pd.DataFrame({'A':[1,2,3], 'B':[4,5,6], 'C':[7,8,9]})a A B C0 1 4 71 2 5 82 3 6 9方法一:暴力方法(bmm: 实践中只有此方法有效,rename方法无效)a.columns = ['a','b','c']a a ...转载 2018-06-06 16:46:57 · 964 阅读 · 0 评论 -
pandas concat
dfTotal = pd.concat([dfTrain, dfTest], axis = 0).fillna('')由于第一列‘name’比其他列长,pandas自动将‘name’列放在了最后一列,如果不想更改列的顺序,需要加入sort = False 即dfTotal = pd.concat([dfTrain, dfTest], axis = 0, sort = False).f...原创 2018-06-06 16:50:24 · 1190 阅读 · 0 评论 -
pandas Series合并add, value_counts
假设se1, se2是series类型, se1 = {computer, circuit, visualization, computer}se1.value_counts()Returns object containing counts of unique values. 也就是取序列中value的交集,并统计每个value出现的次数。value作为index,次数作为序列值。 ...原创 2018-06-06 18:35:59 · 4533 阅读 · 0 评论 -
目录 ./ 和 ../ 和 ../..
./ 表示当前目录…/ 表示父级目录…/… 表示祖父目录原创 2019-07-04 08:52:21 · 10170 阅读 · 0 评论