[DHU数据科学]chapter3

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import xlrd
#3.综合练习1
#(1)
df = pd.read_excel(r"D:\prog\DataScience.xls")
#(2)
print("基本内容及总数:")
print(df.loc[:,:])
#(3)
print("查询是否有NaN:")
nan_rows = df[df.isna().any(axis=1)]
nan_rows.to_csv(r"D:\pro\pre.csv", index=False)
print(f"含有 NaN 的行已成功导出为 pre.csv:\n{nan_rows}")
df.fillna({'星期':4.0,'节次':'5~7','课程':'数据科学导论','类型':'设计型','二级实验室':'人工智能实验室','地点':'11-305'},inplace=True)
df.drop_duplicates()
print(f"填充好的数据集如下:\n{df}")
#(4)
print("\n查询内容:")
print(df.loc[:,['课程','实验项目','类型','二级实验室']])
#(5)
print("\n每门课程的实验数:")
print(pd.crosstab(df['课程'],df['课时数']))
#(6)
print("\n每周开设的课程实验课时数:")
print(pd.crosstab(df['周次'],df['课时数']))
#(7)
print("\n每门课程实验类型分布:")
print(pd.crosstab(df['课程'],df['类型']))
#(8)
#
print("\n每个班级的实验课表:")
#
# grouped = df.groupby(['班级','周次'])
# print(grouped['课程'])
#(9)
print("\n各个二级实验室能够承担的实验课时数:")
print(pd.crosstab(df['二级实验室'],df['课时数']))
#(10)
print("\n各个二级实验室能够支持的实验类型:")
print(pd.crosstab(df['二级实验室'],df['类型']))

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Juneeeeeeeeeeeee

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值