短码
meta life
这个作者很懒,什么都没留下…
展开
-
python:使用 Pathlib 创建多级文件夹
需求:使用pathlib创建多级文件夹。pathlib.Path('./data').mkdir(parents=True, exist_ok=True)parents = True:创建中间级父目录 exist_ok=True: 目标目录存在时不报错原创 2021-06-30 10:03:28 · 5538 阅读 · 0 评论 -
linux 后台运行程序:nohup 使用
需求:令 linux 服务器在后台运行程序。nohup run.sh > out.txt 2>&1 &原创 2021-06-30 09:31:40 · 216 阅读 · 0 评论 -
打印文件某列的所有不同取值:print unique values of a column in a file with awk
需求:打印出来文件某一列的所有不同的取值# vim tmp.csv# 1,a# 2,a# 3,b# 1,c# 2,cawk -F, '{print $1}' tmp.csv | awk -F, '!seen[$1]++'# 1# 2# 3awk -F, '{print $2}' tmp.csv | awk -F, '!seen[$1]++'# a# b# c原创 2021-06-15 12:04:40 · 84 阅读 · 0 评论 -
类别变量的多热编码:encoding categorical variable to multihot embedding
需求:把类别或字符串类型的特征转化为多热编码,特征是逗号、竖线等方式分割import numpy as npimport pandas as pdfrom scipy import sparseclass MultiHotEncoder: """ Encode categorical features as a multi-hot numeric array. Parameters ---------- sep : string, default='原创 2021-06-15 11:19:07 · 903 阅读 · 0 评论 -
类别变量的整数编码:encoding categorical variable to integers
#Createanemptydictionaryordinal_enc_dictordinal_enc_dict={}forcol_nameinusers:#CreateOrdinalencoderforcolordinal_enc_dict[col_name]=OrdinalEncoder()col=users[col_name]#Selectnon-nullvaluesofcol...原创 2021-06-11 12:18:33 · 173 阅读 · 1 评论 -
python 展开嵌套 list: flatten list of list to list
l = [[0,1], [2,3]]flatten_list = [item for subl in l for item in subl]# => [0, 1, 2, 3]原创 2021-06-10 21:47:20 · 767 阅读 · 2 评论