- 博客(4)
- 资源 (9)
- 收藏
- 关注
原创 python实现one-hot编码
''' one-hot编码 '''from sklearn.preprocessing import OneHotEncoder from sklearn.preprocessing import LabelEncoderfrom sklearn.preprocessing import LabelBinarizerfrom sklearn.preprocessing import Mul...
2018-04-16 23:33:37 7480 2
原创 pandas常用数据预处理方法
数据样式python代码df = pd.read_csv('../dataset/ai_risk_train/train_auth_info.csv', low_memory=False)# print(df)'''查看数据的基本信息'''print(df.info())'''整个数据的整体的分布'''print(df.describe())'''查看数据集的空值,或者说是缺失值'''pri
2018-04-10 12:52:55 1887
原创 提取排序特征(python实现)
Series.rank()obj = pd.Series([7, -5, 7, 4, 2, 0, 4])print(type(obj.rank()))print(obj.rank())print (obj.rank(method = 'first',ascending=False))print (obj.rank(method = 'max',ascending=False))print
2018-04-07 17:48:21 1700
原创 求两个pandas.Series的交/并集
名称 功能 intersection 交集 union 并集代码演示>>> import pandas as pd>>> s1 = pd.Series([4,5,6,20,42])>>> s2 = pd.Series([1,2,3,5,42])# 求交集 #>>> pd.Series(list(set(s1).intersection(set(s2))))0 42
2018-04-01 16:28:43 15073 1
windows cp.exe
2017-10-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人