Python数据分析系列
文章平均质量分 66
孙老师的数据分析课
这个作者很懒,什么都没留下…
展开
-
Python爬虫系列-51job爬虫(一)
需求:前段时间有位朋友需要爬取51Job 提取“公司”名称带有“数据分析”的招聘信息 希望这些信息能保存起来以便分析代码如下:'''准备工作安装request安装lxml安装命令:pip install xxx'''# 导入一些工具包import requestsfrom lxml import etreefrom pandas import DataFrame#确定一个对...原创 2018-02-28 10:41:15 · 1115 阅读 · 1 评论 -
Python爬虫系列-51job爬虫(二)
利用for循环爬取多页数据并导出到Excel表格。#导入一些工具包import requestsfrom lxml import etreefrom pandas import DataFrameimport pandas as pdjobInfoAll=DataFrame()#确定一个对象,即网址,关键词:数据分析师for i in range(1,6): url="ht...原创 2018-03-19 10:34:00 · 641 阅读 · 0 评论 -
Python爬虫系列:腾讯课堂Scrapy爬虫
业务需求:需要爬取腾讯课堂IT.互联网类别下的云计算大数据子类别下的所有课程数据:课程名称、价格、购买人数、机构名称1、编写item.py文件定义要爬取的数据字段:import scrapyclass TxktcrawlerItem(scrapy.Item): # define the fields for your item here like: title=scrapy.F...原创 2018-03-28 11:00:31 · 4069 阅读 · 2 评论