![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
pandas
菇綡
123456789
展开
-
pd.get_dummies()与pd.factorize()详解
pandas.get_dummies(将类别变量转换为one-hot编码,使用pandas方法实现,相当于sklearn的one-hot编码) 离散特征的编码分为两种情况:1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:...原创 2019-01-04 21:24:04 · 4957 阅读 · 1 评论 -
pandas学习详细教程
pandas基础篇我们打算从以下几个方面进行代码练习:** 创建Series** Series基本操作** 创建DataFrame** DataFrame基本操作** DataFrame文件操作** Series,DataFrame和多索引** 透视表** 数据清洗** 数据预处理** 可视化创建 Series 数据类型:1)从列表创建 S...原创 2019-01-04 21:56:01 · 1090 阅读 · 0 评论 -
透视表(pivotTab)和交叉表(crossTab)
Pandas:透视表(pivotTab)和交叉表(crossTab)一、透视表(pivotTab)透视表就是将指定原有DataFrame的列分别作为行索引和列索引,然后对指定的列应用聚集函数(默认情况下式mean函数)。 import numpy as npimport pandas as pdfrom pandas import Series,DataFramedf =...转载 2019-01-10 10:56:49 · 1088 阅读 · 0 评论