自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 Ubuntu中按箭头键时终端显示“^[[A” “^[[B” “^[[C” “^[[D”

对于osx(mac)用户,需要将shell更改为bash终端–》偏好设置–〉通用–》shell的打开方式选择为:命令(完整路径)/bin/bash

2020-04-22 14:10:11 190

原创 GPU服务器创建多个账号

目录添加用户并设置密码删除用户添加用户并设置密码添加用户user1,创建配套目录/home/user1,并设置密码abc123useradd -d /home/user1 -m user1passwd user1# 输入设定密码,回车abc123# 再次输入密码确认abc123此时创建了新用户user1,创建配套目录/home/user1,并设置密码abc123删除用户us...

2019-12-26 13:40:00 134

原创 Mac git 安装及使用

下载https://git-scm.com/downloadMac git 下载地址本地配置在本地创建ssh key:ssh-keygen -t rsa -C "your_email@youremail.com"your_email@youremail.com为本人在github上注册的邮箱运行后会要求确认路径和输入密码,直接按一次回车确认路径,再按一次回车设置没有密码。成功后在...

2019-11-26 18:17:26 111

原创 目录 ./ 和 ../ 和 ../..

./ 表示当前目录…/ 表示父级目录…/… 表示祖父目录

2019-07-04 08:52:21 3216

转载 python函数调用参数问题

def example(a, b, c=100):… a = 1 # notice here I am assigning ‘a’… b = 2 # and here the value of ‘b’ is being overwritten… # The value of c is set to 100 by default… print(a,b,c)...

2019-04-09 17:35:27 411

转载 python pandas dataframe 数据筛选

import pandas as pdimport numpy as npdf = pd.DataFrame({‘a’:[1,2,np.nan,np.nan], ‘b’:[4,np.nan,6,np.nan], ‘c’:[np.nan, 8,9,np.nan], ‘d’:[np.nan,np.nan,np.nan,np.nan]})print (df.notnull().any(axis =...

2019-04-08 22:29:40 441

转载 由字典dictionary或列表list创建dataframe

原文链接

2019-04-05 21:07:13 1919

转载 sklearn-CountVectorizer

CountVectorizer会将文本中的词语转换为词频矩阵,它通过fit_transform函数计算各个词语出现的次数。from sklearn.feature_extraction.text import CountVectorizertexts=["dog cat fish","dog cat cat","fish bird", 'bird'] # “dog cat fish” 为输入...

2019-04-04 01:54:21 142

原创 dataframe常用数据处理

import pandas as pdimport numpy as npdf = pd.read_csv(r"C:\Users\xx1.csv")dfT = pd.read_csv(r"C:\Users\xx2.csv")df1 = df.loc[:,['column1','column2']] #取给定两列的所有行df1['label'] = int(0)df2 = dfT.loc...

2019-01-10 19:01:47 562

原创 信息熵、联合熵、条件熵、互信息

信息熵、联合熵、条件熵、互信息1. 自信息量一个随机事件xxx的自信息量1定义为:I(x)=log⁡1p(x)I(x)=\log\frac{1}{p(x)}I(x)=logp(x)1​注意,在信息论中,log⁡\loglog函数的底通常设置为2,此时,自信息量的单位为比特(bit);在机器学习中,log⁡\loglog函数的底通常设置为自然常数e,此时,自信息量的单位为奈特(nat)。...

2018-12-18 03:24:17 4559

原创 anaconda安装第三方包scikit-multiflow

在conda库中没找到scikit-multiflow,在GitHub上下载压缩包,解压到C盘:第一次安装出错,出现Microsoft Visual C++ 14.0 is required 的错误c++ 14.0下载地址https://964279924.ctfile.com/fs/1445568-239446865安装软件,重启电脑,再进行上述install命令,安装成功...

2018-12-16 21:00:09 577 2

原创 vim及linux常用命令

在命令模式下:单行复制:将光标移动到将要复制的行处,按yy进行复制;多行复制:将光标移动到将要复制的首行处,按nyy复制n行;其中n为1、2、3……粘贴:将光标移动到将要粘贴的行处,按p进行粘贴显示行号::set nu移动光标到行尾:$,移动到第n行的行尾n$移动光标到行首:0...

2018-10-12 16:20:37 59

原创 TensorFlow安装与使用

anaconda安装tensorflowpython --version: 查看当前python版本,此处为3.6conda create -n tensorflow python=3.6:新建名为tensorflow的conda环境source activate tensorflow: 激活tensorflow环境pip install tensorflow:在tensorflow环境...

2018-10-12 12:59:08 1287 2

转载 csr_matrix的用法--shape, nnz, data, indices, indptr, toarray

from scipy.sparse import csr_matrixarr = np.array([[0,1,0,2,0],[1,1,0,2,0],[2,0,5,0,0]])b = csr_matrix(arr)#print(b.shape) # (3, 5)#print(b.nnz) #非零个数, 7print(b.data) #非零值, [1 2 1 1 2 2 5]pri...

2018-08-03 16:15:02 2937

原创 python将字符串list写入excel和txt

docs = [‘icassp improved human face identification using frequency domain representation facial asymmetry’, ‘pattern recognition unsupervised methods classification hyperspectral images low spatial re...

2018-07-31 11:31:47 12598

转载 python用列表生成式写嵌套循环

将两个嵌套for循环写成一个列表生成式 如,有一个嵌套列表,a=[[1,2],[3,4],[5,6]],要提取列表里的每一个元素用for循环处理:for i in a: for j in i: print(j)用列表生成式:b=[j for i in a for j in i]#注意两个for的顺序print(b) b=[1, 2, 3,...

2018-07-30 15:47:27 5752 1

转载 nltk-提取词干-去除停用词

from nltk.corpus import stopwords Here is the list: set(stopwords.words(‘english’)) {‘ourselves’, ‘hers’, ‘between’, ‘yourself’, ‘but’, ‘again’, ‘there’, ‘about’, ‘once’, ‘duri...

2018-07-30 11:18:37 8249

转载 csr_matrix参数解析

压缩稀疏矩阵构造时的参数从官网看不明白,参考如下:indptr = np.array([0, 2, 3, 6])indices = np.array([0, 2, 2, 0, 1, 2])data = np.array([1, 2, 3, 4, 5, 6])csr_matrix((data, indices, indptr), shape=(3, 3)).toarray()a...

2018-06-28 14:12:00 1876

原创 vim配置-python版

下载Pydiction插件mkdir ~/.vimmkdir ~/.vim/bundlecd ~/.vim/bundlegit clone https://github.com/rkulla/pydiction.git配置Pydiction#- UNIX/LINUX/OSX: Put python_pydiction.vim in ~/.vim/after/ftplugi...

2018-06-11 14:03:54 758

转载 python中read(), readline(), readlines()

我们谈到“文本处理”时,我们通常是指处理的内容。Python 将文本文件的内容读入可以操作的字符串变量非常容易。文件对象提供了三个“读”方法: .read()、.readline() 和 .readlines()。每种方法可以接受一个变量以限制每次读取的数据量,但它们通常不使用变量。 .read() 每次读取整个文件,它通常用于将文件内容放到一个字符串变量中。然而 .read() 生成文件内容...

2018-06-11 09:34:27 369

原创 pandas Series合并add, value_counts

假设se1, se2是series类型, se1 = {computer, circuit, visualization, computer}se1.value_counts()Returns object containing counts of unique values. 也就是取序列中value的交集,并统计每个value出现的次数。value作为index,次数作为序列值。 ...

2018-06-06 18:35:59 3074

原创 pandas concat

dfTotal = pd.concat([dfTrain, dfTest], axis = 0).fillna('')由于第一列‘name’比其他列长,pandas自动将‘name’列放在了最后一列,如果不想更改列的顺序,需要加入sort = False 即dfTotal = pd.concat([dfTrain, dfTest], axis = 0, sort = False).f...

2018-06-06 16:50:24 948

转载 Pandas中DateFrame修改列名

import pandas as pda = pd.DataFrame({'A':[1,2,3], 'B':[4,5,6], 'C':[7,8,9]})a A B C0 1 4 71 2 5 82 3 6 9方法一:暴力方法(bmm: 实践中只有此方法有效,rename方法无效)a.columns = ['a','b','c']a a ...

2018-06-06 16:46:57 582

原创 设置vim永久显示行号

vim ~/.vimrc打开后添加set nu,保存退出,再次进入vim编辑器,就会自动显示行号了!

2018-06-06 16:12:17 135

原创 删除vi不正常退出产生的swp文件

远程登录服务器ubuntu中vim编辑task.py文件时,连接断掉导致vim不正常退出产生了swp文件。首先使用vi -r task.py恢复文件,然后用下面的命令删除swp文件,不然每一次编辑时总是有提示rm .task.py.swp...

2018-06-06 15:05:15 3671

原创 Pandas——ix vs loc vs iloc区别

loc——通过行标签索引行数据1.1 loc[1]表示索引的是第1行(index 是整数)import pandas as pd data = [[1,2,3],[4,5,6]] index = [0,1] columns=['a','b','c'] df = pd.DataFrame(data=data, index=index, columns=columns) ...

2018-06-05 13:55:08 218

转载 [python] global 和nonlocal

在Python中,当引用一个变量的时候,对这个变量的搜索是按找本地作用域(Local)、嵌套作用域(Enclosing function locals)、全局作用域(Global)、内置作用域(builtins模块)的顺序来进行的,即所谓的LEGB规则。 然而当在一个函数内部为一个变量赋值时,并不是按照上面所说LEGB规则来首先找到变量,之后为该变量赋值。在Python中,在函数中为一个变量赋...

2018-06-05 09:57:10 79

转载 gensim中文教程-及-NLTK, SKLEARN, GENSIM的区别

https://blog.csdn.net/duinodu/article/details/76618638

2018-06-04 17:40:01 1615

转载 Mac连接服务器黑屏时断开

采用方法一 sudo -s vi /etc/ssh/ssh_config 在Host * 下面加入 ServerAliveInterval 60 强制保存退出。具体说明如下: 方法1:MAC客户端配置配置“/etc/ssh/ssh_config”文件“/etc/ssh/ssh_config” 文件是OpenSSH系统范围的配置文件,允许你通过设置不同的选项来改变客户端程...

2018-06-01 14:36:03 584

原创 Mac上传文件至ubuntu服务器~命令行下载git文件~设置python搜索包的路径

在Mac本地terminal中输入 scp 本地文件地址 服务器用户名@服务器地址:文件需要放的地址

2018-06-01 12:51:02 786

原创 Mac登陆服务器及退出

Mac自带登陆服务器的功能:登录:ssh 用户名@服务器地址 退出: control+d

2018-06-01 10:43:41 10038

原创 Anaconda在Ubuntu16.04下安装与卸载

https://blog.csdn.net/daydayjump/article/details/78714001

2018-06-01 10:41:50 13634

原创 coursera machine learning summary

main topicsSupervised LearningLinear regression, logistic regression, neural networks, SVMsUnsupervised LearningK-means, PCA, Anomaly detectionSpecial applications/topicsRecommend...

2018-05-29 12:49:26 100

转载 Hessian矩阵与牛顿法

Hessian矩阵与牛顿法https://blog.csdn.net/haoge921026/article/details/70849263从梯度下降到牛顿法到共轭梯度,到Hessian-Free优化的逻辑https://zhuanlan.zhihu.com/p/23866364Jacobian矩阵和Hessian矩阵 Jacobian矩阵和Hessian矩阵python实...

2018-04-12 15:08:06 352

转载 贝叶斯学习及共轭先验

贝叶斯学习及共轭先验 http://blog.csdn.net/acdreamers/article/details/45026459

2018-03-14 17:15:48 91

原创 机器学习实战2-运行KNN示例

环境配置代码存放地方为: C:\PyCode\ML\knn\Ch02查看当前Python版本 切换Anaconda的编译环境,激活Python2 查看当前Python编译环境 进入Python编译环境 导入数据导入knn模块(也就是knn.py文件),导入数据 使用Matplotlib画图导入matplotlib包时显示不存在,quit()退出当前Python环境,在anaconda中安

2017-10-25 11:16:44 393

原创 Python中strip和split的使用

strip:参数为空时,默认删除开头和结尾处的空白符,包括’\n’,’\r’,’\t’ split:按字符串(单个字符)全部分割ipaddrX = "xx173.10.1.101 \t\n"ipaddrX.strip('x') #删除字符串ipaddr中开头和结尾处的x'173.10.1.101 \t\n'ipaddrX.strip('x').strip() #strip的参数为空时,默认删除

2017-10-25 08:54:09 590

转载 Python·Jupyter Notebook的使用方法

以下链接均为转载:Python·Jupyter Notebook各种使用方法记录[译]27 个Jupyter Notebook的小提示与技巧

2017-10-15 20:47:37 465

原创 Anaconda使用教程-Windows

前言本意是要使用Jupyter(Jupyter官网地址),在Jupyter官网上看到,强烈建议新手使用Anaconda,于是开始下载Anaconda使用。Anaconda是用于管理开源包(packages)和虚拟环境(environment)的系统。Anaconda本身集成Python众多包,并且可以很容易在Python2和Python3之间切换。安装Anaconda下载地址 在Windows中安

2017-09-30 15:20:22 24553 1

原创 集成学习(Ensemble Learning)-bagging-boosting-stacking

Ensemble Learning Bagging Boosting Stacking基本概念集成学习的条件集成学习的种类如何构建具有差异性的基分类器Bagging Bootstrap Aggregating 引导聚合BoostingStacking Stacked generalization算法的对比集成学习的结合策略如何对基分类器的结果进行整合Ensemble Learning

2017-09-03 19:05:40 6499

提示
确定要删除当前文章?
取消 删除