Python11-pandas整理03

pandas数据预处理

 

——脏数据

  • 空值处理
  • 重复值处理
  • 异常值
  • 数据类型转换 

——结构问题

  • 索引设置

*****************************************************************************************************************

  • 空值处理

                * 查看   df.isnull()

                * 删除   df.dropna()     默认删除包含空值的这一行   如果这一行全为空值时再删除,则设置df.dropna(how = "all")

                * 填充   df.fillna()         df.fillna({"性别":"男", "年龄":"30"})   ——  对多列填充不同值

 

  • 重复值处理

                * 删除   df.drop_duplicates()    默认保留首次出现的行  keep="last" 保留最后出现的  keep=Flase 重复值全部删除

 

  • 异常值的检测与处理

                * 检测:相比正常数据过高/过低的数据。(超过划定的正常范围、箱式图上下边缘以外的点、正态分布偏差超过3σ的值)

                * 处理:删除、填充、当特殊值研究——Python中的过滤、replace()等

 

  • 数据类型转换

                .dtype()  查看数据类型   .astype("float64") 转换数据类型


 

  • 索引设置

                * 添加索引:  df.index = [1,2,3,4,5]

                * 重设索引:  df.set_index ("订单编号")  ——  以订单编号作为新索引    层次索引——set_index()里传入两个/多个参数

                * 重命名索引:  df.rename(index = {1:"一", 2:"二",3:"三"},columns = {"订单编号":"新订单编号"})

                * 重置索引:   针对层次化索引,将索引转为列                  默认全部转化df.reset_index()   

                                      df.reset_index(level = 0)——将第0级索引转化为columns     df.reset_index(level = 1)——将第1级索引转化为columns 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
前台: (1)注册登录模块:按照学校的相关规定进行注册和登录。 (2)招聘信息查看:高校毕业生们可以网站首页上查看所有的招聘信息,除此之外还可以输入公司名称或岗位名称进行搜索。 (3)用人单位模块:此模块为宣传用人单位的主要功能模块,具体包括用人单位简介、岗位需求及职责及公司介绍等功能。 (4)就业指导:学生朋友们在就业前可以通过此模块获取指导。 (5)新闻信息:为了让用户们可以了解到最新的新闻动态,本系统可以通过新闻信息查看功能阅读近期的新闻动态。 (6)在线论坛:毕业季的同学们可以通过此模块相互交流。 后台: (1)系统用户管理模块:可以查看系统内的管理员信息并进行维护。 (2)学生管理模块:通过此功能可以添加学生用户,还可以对学生信息进行修改和删除。 (3)用人单位管理模块:管理员用户通过此模块可以管理用人单位的信息,还可以对用人单位信息进行查看和维护。 (4)招聘管理模块:管理员通过此功能发布和维护系统内的照片信息。 (5)就业指导管理模块:通过此模块可以编辑和发布就业指导信息,从而更好的帮助就业季的同学们。 (6)论坛管理:通过论坛管理可以查看论坛中的主题帖及里面的回复信息,除此之外还可以对论坛中的信息进行维护和管理。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值