python对excel数据清洗_python数据清洗excel-阿里云开发者社区

python清洗excel的数据还是很简单的

这里就列举例子说一下

这是原始数据,这里要处理的是地区和薪水两个字段。

清洗前数据

import xlrd

import codecs

import re

def get_salary(salary):

# 利用正则表达式提取月薪,把待遇规范成千/月的形式

# 返回最低工资,最高工资的形式

if '-' in salary: # 针对1-2万/月或者10-20万/年的情况,包含-

low_salary = re.findall(re.compile('(\d*\.?\d+)'), salary)[0]

high_salary = re.findall(re.compile('(\d?\.?\d+)'), salary)[1]

if u'万' in salary and u'年' in salary: # 单位统一成千/月的形式

low_salary = float(low_salary) / 12 * 10

high_salary = float(high_salary) / 12 * 10

elif u'万' in salary and u'月' in salary:

low_salary = float(low_salary) * 10

high_salary = float(high_salary) * 10

else: # 针对20万以上/年和100元/天这种情况,不包含-&#

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值