pandas
pandas
潘旭阳
秉承一颗改变人们生活方式、推动地球进步的心志,畅游在AI知识的广袤海洋, 就算你是一只洁白无瑕的小白,坚持下去,总有一天,你也能够登上属于自己的AI舞台。
展开
-
dataframe基本操作
import pandas data = pandas.DataFrame(columns=['a','b'], data=[[1,2],[3,4], [3,4]]) print('*'*20, '原始数据') print(data) print('*'*20, '在右边增加列') data['c'] = [5,5,3] data['d'] = [8,8,8] print(data) print('*'*20, '在下边增加行')...原创 2022-03-14 15:40:58 · 2472 阅读 · 0 评论 -
pandas从日期属性中提取年月日
在数据挖掘过程中,日期属性是非数值属性, 不能直接输入到模型,将日期属性拆分成年、月和日是必要的。date属性是object类型的, 通过取单元格可以发现它是字符串类型,这样很容易提取年、月、日将日期属性拆分成年、月、日, 代码如下:def DateSplit(df, col): """ split the object of '2010-01-02' int...原创 2019-05-25 19:47:47 · 24804 阅读 · 12 评论 -
pandas数据清洗常用操作总结(二)
连续数值数据和有意义的离散数据,才能够送入到模型进行训练, 对于缺失值、字符串数据和离散数据必须做处理1 缺失值检测和处理(1)检测df.info() 或 df.isnull()数据量比较大:用np.sum(df.isnull().any()) 和 np.sum(df.isnull().all())(2)处理a.删除法;DataFrame.dropna(axis=0, how=‘a...原创 2019-05-24 21:38:25 · 979 阅读 · 0 评论 -
pandas数据清洗常用操作总结 (一)
了解对于工程师拿到一批original data, 不能急切着去做特征工程、建模预测等,因为original data可能有缺失值、字符串、离散数据(比如衣服尺寸S、M和L分别标记为1,2,3), 必须要对original data 做必要的处理。本教程以加拿大University of New Brunswick的NSL-KDD数据集为操作对象,来进行pandas常用操作讲解...原创 2019-05-24 15:37:54 · 3471 阅读 · 0 评论