- 博客(8)
- 收藏
- 关注
原创 python:使用 Pathlib 创建多级文件夹
需求:使用pathlib创建多级文件夹。pathlib.Path('./data').mkdir(parents=True, exist_ok=True)parents = True:创建中间级父目录 exist_ok=True: 目标目录存在时不报错
2021-06-30 10:03:28 5413
原创 linux 后台运行程序:nohup 使用
需求:令 linux 服务器在后台运行程序。nohup run.sh > out.txt 2>&1 &
2021-06-30 09:31:40 209
原创 辨析:最小二乘、线性回归与极大似然
最小二乘:也称为最小二乘法,英文 Least square method;线性回归:英文Linear regression,有时也会用“线性模型”指代;极大似然:
2021-06-18 23:20:48 1495 1
原创 打印文件某列的所有不同取值:print unique values of a column in a file with awk
需求:打印出来文件某一列的所有不同的取值# vim tmp.csv# 1,a# 2,a# 3,b# 1,c# 2,cawk -F, '{print $1}' tmp.csv | awk -F, '!seen[$1]++'# 1# 2# 3awk -F, '{print $2}' tmp.csv | awk -F, '!seen[$1]++'# a# b# c
2021-06-15 12:04:40 76
原创 类别变量的多热编码:encoding categorical variable to multihot embedding
需求:把类别或字符串类型的特征转化为多热编码,特征是逗号、竖线等方式分割import numpy as npimport pandas as pdfrom scipy import sparseclass MultiHotEncoder: """ Encode categorical features as a multi-hot numeric array. Parameters ---------- sep : string, default='
2021-06-15 11:19:07 879
原创 类别变量的整数编码:encoding categorical variable to integers
#Createanemptydictionaryordinal_enc_dictordinal_enc_dict={}forcol_nameinusers:#CreateOrdinalencoderforcolordinal_enc_dict[col_name]=OrdinalEncoder()col=users[col_name]#Selectnon-nullvaluesofcol...
2021-06-11 12:18:33 164 1
原创 python 展开嵌套 list: flatten list of list to list
l = [[0,1], [2,3]]flatten_list = [item for subl in l for item in subl]# => [0, 1, 2, 3]
2021-06-10 21:47:20 742 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人