2019年03月_pipipippipipipipip

原创关于修改WIFI代理后手机部分APP无法使用的解决办法

关于修改WIFI代理后手机部分APP无法使用的解决办法最近在练习爬虫抓取手机app数据时出现了一个问题，就是修改wifi代理，使用fiddler代理时，使用斗鱼app显示无法连接到服务器，在网上搜索了一下结果，个人觉得可能是网络证书的问题，下面是我自己的解决方法解决方法在手机浏览器中输入地址：http://localhost:8888/, 点击FiddlerRoot certifica...

2019-03-29 16:03:43 10838 5

原创使用爬虫获取ajax数据

使用爬虫获取豆瓣电影排名信息分析因为豆瓣电影排行榜内容使用ajax加载的，如果只是简单访问 url “https://movie.douban.com/typerank?type_name=剧情&type=11&interval_id=100:90&action=” 得到的只是这个页面的一个框架html，并没有需要的实质性的内容经过抓包分析，发现内容数据在 url ...

2019-03-27 13:52:55 591

原创使用selenium获取ajax加载的页面信息

使用selenium获取ajax加载的页面信息实验网站：豆瓣电影剧情片主要使用模块：selenium (pip install selenium)lxml (pip install lxml)主要思路：因为直接使用selenium访问豆瓣页面是不行的，需要让selenium执行一段js脚本滑动滚动条，才能使豆瓣页面刷新，获取到需要的内容。代码如下"""使用s...

2019-03-27 13:42:52 6054

原创使用selenium+BeautifulSoup统计斗鱼lol板块信息

使用selenium+BeautifulSoup统计斗鱼lol板块信息闲来无事，使用selenium对斗鱼的页面进行了一下请求练习，并且对页面的数据进行了简单统计不得不说得出了惊人的数据，斗鱼仅仅是英雄联盟板块的热度就有7000多万…注意：测试数据和时间结点有关"""本来想爬取前10页内容，结果发现第一页都挺多的，就只爬取了第一页"""from selenium import w...

2019-03-26 22:14:14 138

原创 python3爬虫爬取百度贴吧下载图片

python3爬虫爬取百度贴吧下载图片学习爬虫时没事做的小练习。百度对爬虫还是很友好的，在爬取内容方面还是较为容易。可以方便各位读者去百度贴吧一键下载每个楼主的图片，至于是什么类型的图片，就看你输入什么关键字了。使用python模块使用urllib进行爬取（python3自带不用额外安装）使用xpath进行数据提取（pip install lxml)from urllib i...

2019-03-25 21:05:55 455

原创使用urllib.request+xpath爬取糗事百科文字内容

使用urllib.request+xpath爬取糗事百科文字内容最近在学习爬虫，闲来无事进行了一个小练习，对糗事百科中的文字板块内容进行了爬取，并进行了整理，然后存入到了json文件中。废话不多说，直接上代码。from urllib import requestimport jsonfrom lxml import etreeclass QiuShiSpider: ""...

2019-03-25 20:47:51 1050

原创 jquery使用 360 jsonp公开接口

jquery使用360 jsonp公开接口在学习jquery实现jsonp的跨域请求数据时，出现了些小问题，查阅了一些网上已有的文章，发现有些文章在细节方面多少有些问题，所以便想把自己发现的问题写出来。废话不多说，直接上代码<!DOCTYPE html><html> <head> <meta charset="utf-8"> &...

2019-03-16 15:02:59 362

weixin_43182689的博客