自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

eval_life, 享受Ruby的美好~

关于ruby的点滴

  • 博客(8)
  • 收藏
  • 关注

原创 python:使用 Pathlib 创建多级文件夹

需求:使用pathlib创建多级文件夹。pathlib.Path('./data').mkdir(parents=True, exist_ok=True)parents = True:创建中间级父目录 exist_ok=True: 目标目录存在时不报错

2021-06-30 10:03:28 5413

原创 linux 后台运行程序:nohup 使用

需求:令 linux 服务器在后台运行程序。nohup run.sh > out.txt 2>&1 &

2021-06-30 09:31:40 209

原创 辨析:线性回归需要正太分布假设么?

答案:否。《辨析:最小二乘、线性回归与极大似然》

2021-06-20 22:13:21 1750

原创 辨析:最小二乘、线性回归与极大似然

最小二乘:也称为最小二乘法,英文 Least square method;线性回归:英文Linear regression,有时也会用“线性模型”指代;极大似然:

2021-06-18 23:20:48 1495 1

原创 打印文件某列的所有不同取值:print unique values of a column in a file with awk

需求:打印出来文件某一列的所有不同的取值# vim tmp.csv# 1,a# 2,a# 3,b# 1,c# 2,cawk -F, '{print $1}' tmp.csv | awk -F, '!seen[$1]++'# 1# 2# 3awk -F, '{print $2}' tmp.csv | awk -F, '!seen[$1]++'# a# b# c

2021-06-15 12:04:40 76

原创 类别变量的多热编码:encoding categorical variable to multihot embedding

需求:把类别或字符串类型的特征转化为多热编码,特征是逗号、竖线等方式分割import numpy as npimport pandas as pdfrom scipy import sparseclass MultiHotEncoder: """ Encode categorical features as a multi-hot numeric array. Parameters ---------- sep : string, default='

2021-06-15 11:19:07 879

原创 类别变量的整数编码:encoding categorical variable to integers

#Createanemptydictionaryordinal_enc_dictordinal_enc_dict={}forcol_nameinusers:#CreateOrdinalencoderforcolordinal_enc_dict[col_name]=OrdinalEncoder()col=users[col_name]#Selectnon-nullvaluesofcol...

2021-06-11 12:18:33 164 1

原创 python 展开嵌套 list: flatten list of list to list

l = [[0,1], [2,3]]flatten_list = [item for subl in l for item in subl]# => [0, 1, 2, 3]

2021-06-10 21:47:20 742 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除