一、需求:
对爬取的csv文件进行数据清洗
运用内容:pandas、正则表达式
二、简单分析:
共176条数据
其中,分析目标以全职为准,但职位名称包含实习信息,需要删除掉。
数据方面:csv保存格式为str,运用正则表达式提取数值工作经验去平均值,工资按市场情况,取工资范围前25%。
三、代码:
import pandas as pd df = pd.read_csv('lagou8.4jobs.csv',encoding=
一、需求:
对爬取的csv文件进行数据清洗
运用内容:pandas、正则表达式
二、简单分析:
共176条数据
其中,分析目标以全职为准,但职位名称包含实习信息,需要删除掉。
数据方面:csv保存格式为str,运用正则表达式提取数值工作经验去平均值,工资按市场情况,取工资范围前25%。
三、代码:
import pandas as pd df = pd.read_csv('lagou8.4jobs.csv',encoding=