Python_pandas对excel的操作

一. 基本操作

import pandas as pd

# 读取Excel文件
data = pd.read_excel('read.xlsx')

#将data写入Excel文件
data.to_excel('write.xlsx', index=False)  # 不含索引

#选定一列
lie_data = data['x']  #x为列标签,在第一行 如 user_a user_b problem_id ... 

#删除列
data.drop('user_a', axis=1)  #axis=1列 =0行

#新增列
data['name'] = [7, 8, 9]  #name为新的列标签

#选定一行
hang_data = data.loc[y]  #y为行标签/索引,默认0 1 2 3 4...(从列标签下一行开始)

#删除行
data.drop(y)

#新增行
new_data={'user_a': 'zake', 'user_b': 'joker',....}
data = data.append(new_data, ignore_index=True)

#单元格修改
data.at[0, 'user_a'] = 'zjx666'  # 将第一行,'user_a' 列的值修改为 'zjx666'




二. 数据处理

#按数据大小筛选行
copy_data = data[data['similarity'] > 90]  #筛出similarity(查重率)那列大于90的所有数据行

#按数据内容筛选行
name_data = data[data['user_a'].isin(['zake', 'joker'])]  #筛出 user_a 叫zake或joker的数据行

#按某列排序
sort_data = data.sort_values(by='similarity', ascending=False)  #按查重率那列降序排序

#ascending=False(降序)
#ascending=True(升序)

#算score列均值
avg = data['score'].mean()

#score列求和
sum = data['score'].sum()

#方差
data['score'].var()

#加权平均并写入
data['junzhi'] = data['score1'] *0.4 + data['score2'] * 0.6

  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值