- 博客(5)
- 资源 (1)
- 收藏
- 关注
原创 将稠密矩阵转化为稀疏矩阵
import numpy as npfrom scipy import sparse# dense matrixA = np.array([[1,2,0],[0,0,3],[1,0,4]])# sparse matrixsA = sparse.csr_matrix(A)# print dense matrixprint(A)[[1 2 0][0 0 3][1 0 4]]...
2019-09-25 16:29:50 8111
原创 正则表达式
正则表达式的全部符号表示:符号描述\转义符。例如,‘n’ 匹配字符 “n”。’\n’ 匹配一个换行符。序列 ‘\’ 匹配 “” , “(” 则匹配 “(”。^匹配输入字符串的开始位置。$匹配输入字符串的结束位置。*匹配前面的子表达式零次或多次。例如,zo* 能匹配 “z” 以及 “zoo”。* 等价于{0,}。+匹配前面的子表达式一次或多次。...
2019-09-24 16:44:08 135
原创 基于gensim的lda实践
基于gensim的lda实践from gensim.test.utils import common_textsfrom gensim.corpora.dictionary import Dictionaryfrom gensim.models.ldamodel import LdaModel# Create a corpus from a list of textstexts = [...
2019-09-24 11:58:26 1031 1
原创 linux环境下安装anconda
安装将 anconda 的 linux版安装包下载到 linux服务器上:附:anconda安装包列表$ wget https://repo.anaconda.com/archive/Anaconda3-2019.03-Linux-x86_64.sh安装$ sh Anaconda3-2019.03-Linux-x86_64.sh安装程序会询问是否把bin目录加入PATH(L...
2019-09-18 11:33:17 516
原创 pandas按照 某类别 等比例划分test集
df = pd.read_csv('data4000.csv') # 读取数据test = pd.DataFrame() # 划分出的test集合train = pd.DataFrame() # 剩余的train集合tags = df['标签'].unique().tolist() # 按照该标签进行等比例抽取for tag in ...
2019-09-01 23:42:09 2876
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人