python医疗大数据清洗_使用Python爬取、清洗并分析前程无忧的大数据职位

该博客使用Python读取并清洗了前程无忧的大数据职位数据,通过分析得出城市职位数量和平均薪资的前20排名,并利用词云展示职位名称和工作地点的热点。
摘要由CSDN通过智能技术生成

1 #-*- coding: utf-8 -*-

2 """

3 Created on Wed Nov 1 20:15:56 20194

5 @author: loo6 """

7

8 importmatplotlib.pyplot as plt9 importcsv10 importnumpy as np11 importre12 from wordcloud importWordCloud,STOPWORDS13

14

15 defreadFile():16 """

17 读取清洗后的文件18 """

19 data =[]20 with open("cleaned_51jobs.csv",encoding='gbk') as f:21 csv_reader = csv.reader(f) #使用csv.reader读取f中的文件

22 data_header = next(csv_reader) #读取第一行每一列的标题

23 for row in csv_reader: #将csv文件中的数据保存到data中

24 data.append(row)25

26 nd_data = np.array(data) #将list数组转化成array数组便于查看数据结构

27 jobName =nd_data[:, 0]28 locality = nd_data[:, 1]29 minSalary = nd_data[:, 2]30 maxSalary = nd_data[:, 3]31 returndata, jobName, locality, minSalary, maxSalary32

33

34

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值