训练营day4 pandas库:数据的读取和连续变量缺失值的补全

#导入pandas库,读取数据
import pandas as pd
data = pd.read_csv(r"/Users/jocelynzhong/Desktop/p训练营/python60-days-challenge-master/data.csv")
print(data)

#查看数据的类型
type(data)
print(type(data))  #data是<class 'pandas.core.frame.DataFrame'>

#查看数据类型
a=1
type(a)
print(type(a)) #a是<class 'int'>

#查看缺失值,结果是布尔值
data.isnull()
print(data.isnull()) #true是空值

#查看行数
data.head(5)
print(data.head(5))

#导入openpyxl库,读取excel文件
import openpyxl as op
data2 = pd.read_excel(r"/Users/jocelynzhong/Desktop/p训练营/python60-days-challenge-master/data.xlsx")
print(data2 )

#查看前5行
data.head(5)
print(data.head(5))

#数据信息的查看
#此时data是一个dataframe类型的对象,可以理解为dataframe类的实例。实例就具有类的属性和方法。
#1. 属性的调用格式为:实例名.属性名。
#2. 方法的调用格式为:实例名.方法名()。

#导入pandas库,读取数据
import pandas as pd
data = pd.read_csv(r"/Users/jocelynzhong/Desktop/p训练营/python60-days-challenge-master/data.csv")
print(data)

#查看数据的类型
type(data)
print(type(data))

# 列名、非空值、数据类型
data.info()
print(data.info())

# 将元组列表转换为 DataFrame
data_df = pd.DataFrame(data)

# 现在可以调用 shape 方法\
print(data_df.shape)

# 所有列名 data的属性
data.columns
print(data.columns)

# 数值列的基本统计量
data.describe()
print(data.describe())

# dtype是data type的缩写,用于描述数据类型。后续会频繁借助这个方法来查看某一列数据的属性
data.dtypes       # 各列数据类型
print(data.dtypes)

# 查看某一列的数据类型
data["Annual Income"].dtype
print(data["Annual Income"].dtype)

#查看缺失值
data.isnull()
print(data.isnull())

#查看缺失值的数据类型
type(data.isnull())
print(type(data.isnull()))

#求缺失值总和
data.isnull().sum()
print(data.isnull().sum())

@浙大疏锦行

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值