前程无忧薪资数据过滤代码
过滤为每月多少元
a = 0
# 40-80万/年
if re.findall(r'(.*)\-(.*)\万\/\年', i):
s = re.findall(r'(.*)\-(.*)\万\/\年', i)[0]
a = float(s[0]) * 10000 / 12
# 保留2位小数
a = round(a, 0)
# '9.5千-1.4万·13薪'
elif re.findall(r'(.*)\千\-(.*)\万\·(.*)\薪', i):
s = re.findall(r'(.*)\千\-(.*)\万\·(.*)\薪', i)[0]
a = float(s[0]) * 1000 * float(s[2]) / 12
# 保留2位小数
a = round(a, 0)
# '2-3万·13薪'
elif re.findall(r'(.*)\-(.*)\万\·(.*)\薪', i):
s = re.findall(r'(.*)\-(.*)\万\·(.*)\薪', i)[0]
a = float(s[0]) * 10000 * float(s[2]) / 12
# 保留2位小数
a = round(a, 0)
# 6-8千·13薪
elif re.findall(r'(.*)\-(.*)\千\·(.*)\薪', i):
s = re.findall(r'(.*)\-(.*)\千\·(.*)\薪', i)[0]
a = float(s[0]) * 1000 * float(s[2]) / 12
# 保留2位小数
a = round(a, 0)
# 6千-1.2万
elif re.findall(r'(.*)\千\-(.*)\万', i):
s = re.findall(r'(.*)\千\-(.*)\万', i)[0]
a = float(s[0]) * 1000
# 保留2位小数
a = round(a, 0)
# '6-8千'
elif re.findall(r'(.*)\-(.*)\千', i):
s = re.findall(r'(.*)\-(.*)\千', i)[0]
a = float(s[0]) * 1000
# 保留2位小数
a = round(a, 0)
# '6-8万'
elif re.findall(r'(.*)\-(.*)\万', i):
s = re.findall(r'(.*)\-(.*)\万', i)[0]
a = float(s[0]) * 10000
# 保留2位小数
a = round(a, 0)
前程无忧城市数据对应
'010000': '北京',
'020000': '上海',
'030000': '广州',
'040000': '深圳',
'180200': '武汉',
'200200': '西安',
'080200': '杭州',
'070200': '南京',
'090200': '成都',
'060000': '重庆',