爬取了51job上面的数据,其中有薪资字段需要做处理
数据部分格式如下图:
处理好之后的数据截图:
处理需求:
1.把 “salary” 列中带“ 万/年 元/天 ”关键字的行都删除
2.把 “salary” 列中 带“千/月” 关键字的数据变换一下 如“6-9千/月”转化为“6k-9k”
3.把 “salary” 列中 带“万/月” 关键字的数据变换一下 如“1-1.5万/月”转换为"10k-15k"
处理代码:
# -*- coding: utf-8 -*-
import csv
import codecs
import pandas as