python list平均数_数据分析之Python干货笔记

c6e73e8d585a8f2efb7649bc8983a170.png

本篇文章分享数据分析中Python常用代码,包括数据预览、数据清洗、特征分析等,每一大类里面也会具体细分,尽可能全面、易懂,之后实际运用中需要哪种可以选择性参考运用。

文中会结合实际案例展示效果,数据集选用上次参加比赛的二手车价格预测为例。

一、数据预览

数据预览,是数据分析的重要一步,数据分析前对数据集进行预览,才能更加了解整个数据结构,做到心中有数。

1.1查看数据表

shape:查看数据大小

# 输出数据的大小信息
print('Train data shape:',Train_data.shape)

d720b027a2bff2a24881f9c45b50e5ac.png

Train data shape: (150000, 31) 代表Train data数据集有 150000行数据(不包含首行),31列字段,整体是150000

equation?tex=%5Ctimes 31.

dtyes:查看数据类型

Train_data.dtypes

54f4e8156444777cb4b0b19cf0b57cc6.png

columns:只查看列名

Train_data.columns

551d5051cd8d8d9ec5db94e1bde078c0.png

info:查看列名及NAN缺失信息

Train_data.info()

9c7604beddf20f4db1fd0bb58ae5ae78.png

1.2预览数据

head:头

Train_data.head()   #默认显示5行

tail:尾

Train_data.tail()

append:头+尾

Train_data.head().append(Train_data.tail())

430ea1ea81706a6722cf4f08dcd196e8.png

注:如果想显示中间隐藏的列...,可以添加如下代码

pd.set_option('display.max_column',None)    #展示所有列

1.3描述统计

describe:查看数值特征列的一些统计信息

Train_data.describe()

fd556b457013c5aeb6960168d5db434b.png

describe(include=['O']):查看object特征列的一些统计信息

describe(include=['O'])

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值