编辑推荐:
本文来自csdn
,文章主要介绍了python做数据分析时,数据的的读取和处理,以及静态结构分析等相关内容。
前言
首先我们做数据分析,想要得出最科学,最真实的结论,必须要有好的数据。而实际上我们一般面对的的都是复杂,多变的数据,所以必须要有强大的数据处理能力,接下来,我从我们面临的最真实的情况,一步一步教会大家怎么做。
1.数据的读取
(1)读取模块
Import pandas as pd
Import numpy as np
(2)读取表格的全部数据
df = pd.read_csv(".data/HR.csv")
(3)读取你所需要的数据
sl_s=df["sactisfaction_level"]
2. 数据的处理
2.1.异常值(空值)处理
2.1.1删除
首先,第一步是对空值的处理。
有两种,一种直接删除,另一种指代。
如果数据多,想简单一点,就直接删除,方法都很简单。
首先,建立一个DataFrame表
1.为了确定是否含有空值:
df.isnull() #如果含有空值,返回True
2.删除
df.dropna() #去掉含空值的行
如果想要删除某一个属性含空值的行就加入subset参数
df.dropna(subset=["B"]) #去掉B属性含空值的行
判断是