删除所有数据_pandas数据清洗删除没有序号的所有行的数据

f78a9e487e259c9c4fe65b763efcc9bb.png

pandas数据清洗-删除没有序号的所有行的数据
.

问题:我的数据如下,

要求:我想要的是:有序号的行留下,没有序号的行都不要

d4c52647351b784b8c3e26c291487873.png

【代码及解析】

import pandas as pd

filepath="E:/yhd_python/pandas.read_excel/student.xlsx"

df=pd.read_excel(filepath,sheet_name='Sheet1',skiprows=1)

df.tail()

先导入pands包,用read_excel读取文件,工作表为“Sheet1”,标题在第二行,所以跳过一行skiprows=1
方法:read_excel

pd.read_excel(io,sheetname=0, header=0, skiprows=None, index_col=None,names=None,arse_cols=None,date_parser=None,na_values=None,thousands=None,convert_float=True,has_index_names=None,converters=None,dtype=None, true_values=None,false_values=None,engine=None,squeeze=False,**kwds)

sheetname:默认是sheetname为0,返回多表使用sheetname=[0,1],若sheetname=None是返回全表

header :指定作为列名的行,默认0,即取第一行

skiprows:省略指定行数的数据

skip_footer:省略从尾部数的行数据
**继续**

lst=[]

for index,row in df.iterrows():

   if type(row[0])!=int:

       lst.append(index)

lst

定义一个空列表,用于存储第一列中数据类型不是int的的行号

方法:iterrows() 是在数据框中的行进行迭代的一个生成器,它返回每行的索引及一个包含行本身的对象。

 所以,当我们在需要遍历行数据的时候,就可以使用 iterrows()方法实现了。

df1=df.drop(labels=lst)

删除l列表lst存储的所有行号

【效果图】 :

641cf5025b32d2c17c572bedfbdb1283.png

dde871a02549b71348ccadb7ae60d3f2.png

完成


===今天学习到此===

348914cc608cb8d11215058ae5b19fb9.png

ba0fa4831d499d862d08defaeb39d13e.png 转载是一种动力 分享是一种美德
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值