自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

心之所向的博客

随缘更新

  • 博客(7)
  • 收藏
  • 关注

原创 python爬虫——用Scrapy框架爬取阳光电影的所有电影

python爬虫——用Scrapy框架爬取阳光电影的所有电影1.附上效果图2.阳光电影网址http://www.ygdy8.net/index.html3.先写好开始的网址 name = 'ygdy8' allowed_domains = ['ygdy8.net'] start_urls = ['http://www.ygdy8.net/index.html']4....

2019-06-04 19:22:37 2540

原创 python数据分析——用jieba和词云做知乎的数据分析

python数据分析——用jieba和词云做知乎的数据分析1.附上效果图2.我先用爬虫爬取了知乎2019年知乎问题和描述(我之前写过的爬虫https://blog.csdn.net/weixin_45019310/article/details/89923644),再进行数据分析3.先用jieba进行分词mytext = open(r'D:\pycharm\python项目\知乎\zh...

2019-05-26 12:47:23 2657 1

原创 python爬虫——用selenium爬取淘宝商品信息

python爬虫——用selenium爬取淘宝商品信息1.附上效果图2.淘宝网址https://www.taobao.com/3.先写好头部browser = webdriver.Chrome()wait = WebDriverWait(browser,20)#设置等待时间为20秒url ='https://www.taobao.com/'keyword = 'python爬虫'...

2019-05-26 10:31:51 9468 7

原创 python爬虫——用selenium爬取京东商品信息

python爬虫——用selenium爬取京东商品信息1.先附上效果图(我偷懒只爬了4页)2.京东的网址https://www.jd.com/3.我这里是不加载图片,加快爬取速度,也可以用Headless无弹窗模式options = webdriver.ChromeOptions()options.add_experimental_option('prefs', {'profile....

2019-05-10 09:32:37 7007 2

原创 python爬虫——关于ajax加载之爬取2019年知乎问题和描述

python爬虫——关于ajax加载之爬取2019年知乎问题和描述1.先放上效果图(描述为空的原因是本来就没写描述或者只放了图片被我去掉了).2.知乎网址https://www.zhihu.com/3.先写好请求头(知乎是需要登录才能看的,所以一定要写cookie,而且要过几天cookie就会过期,一定要记得更新,老夫就是栽在这上面耽误了好久)#请求头headers = { ...

2019-05-07 16:23:23 1567 1

原创 python爬虫——多线程的简单实例

python爬虫——多线程的简单实例1.先附上没有用多线程的包图网爬虫的代码import requestsfrom lxml import etreeimport osimport timestart_time = time.time()#记录开始时间for i in range(1,4): #1.请求包图网拿到整体数据 response = requests.ge...

2019-05-07 14:25:17 2635 1

原创 python爬虫——用xpath做一个简单爬虫

Python爬虫——用xpath做一个简单爬虫1.效果图.2.网页传送门.3.进入网页后按F12打开开发者工具,用鼠标样的按钮定位到指定位置4.上图中有所有我们要的数据,标题(大气震撼党政党建图文片头AE模板)和视频链接( //video-qn.ibaotu.com/18/06/49/508888piCHsa.mp4_10s.mp4) ,就开始写代码了,首先先导入包import re...

2019-05-06 11:41:05 1181

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除