数据处理中python那些常用的代码

  1. 学会读取数据

#读取csv文件
df=pd.read_csv("C:\\Users\\Administrator\\Desktop\\data.csv",encoding="ANSI")
  1. 获取数据列名

#获取列名
feature_name=df.columns.values
print(feature_name)
  1. 取出某一列

#取出'时间'对应列
time=df['时间']
#'时间'列的索引为3
time=df.iloc[:,3]
  1. 循环时跳过异常(报错),继续下一次循环

form tqdm import tqdm
for w in tqdm(web): # tqdm是进度条
        try:#如果没有报错,则执行下语句1
            语句1
            #否则执行except下的语句2,忽略错误并进入下一次循环
        except OSError:
            语句2
            pass
        continue
  1. 查找某个值对应的行

#查询“甘肃”对应的行数据,甘肃对应的列名为省份
df[df["省份"].isin(["甘肃"])]
  1. 给数据集列名重新命名

#给数据集df的列名重命名为'A'、 'B',、'C',df有3列
df.columns=['A', 'B', 'C']
  1. 获取数据维度,查看数据类型

#数据维度
df.shape
df.shape[0]
df.shape[1]
df.shape[2]
#数据类型
type(df)
  1. 两个dataframe数据集相减df1-df2

df_new = pd.concat([df1, df2, df2]).drop_duplicates(keep=False)
  1. 保存数据为csv文件

df.to_csv("C:\\Users\\Administrator\\Desktop\\数据名.csv")

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值