Python爬虫
文章平均质量分 71
关于爬虫
嘿,小胖墩
这个作者很懒,什么都没留下…
展开
-
Python爬取全国大学排名 用pyecharts进行大屏可视化
院校网址:http://college.gaokao.com/schlist/p先找到对应的全部list需要先安装requests,lxml可直接用 pip install requests pip install lxml 命令安装导入需要的相关包import requestsfrom lxml import etreeimport timeimport r...原创 2019-12-26 16:14:48 · 7169 阅读 · 16 评论 -
破解安居家数字加密成功爬取
前两天做到爬取租房网站的一个爬虫题目诈一看还挺简单(之前从来没有爬过租房网站)下一刻我就后悔了里面的数字竟然是乱码瞬间不知所措(奔溃边缘徘徊)就是这个东西这是个嘛也没学过类似于这种解码的东东然后就疯狂的找博客(写的是不少,能用的却没几个)最终在昨天寻找到了一篇还算比较靠谱的博客(大神)https://blog.csdn.net/qq_38105596/article/details/90177...原创 2020-01-17 14:03:18 · 13710 阅读 · 4 评论 -
爬取安居客租房数字乱码求解决
弄一下午的爬虫好不容易把数字的乱码解决了却发现里面的数字全部都是假的,大佬们看到能帮我解决一下嘛在线等啊下面是我写的代码import requestsfrom lxml import etreeimport timeimport jsonimport randomimport base64from fontTools.ttLib import TTFontimport refro...原创 2020-01-14 14:52:18 · 1141 阅读 · 0 评论 -
爬取淘宝python书籍销售情况动态网页
在淘宝中搜索python查看一共显示100页点击下一页时头标的url数值并未改变此时断定这是一个动态网页所有此时我们需要找到它的json数据,在点击下一页的同时查看XHR中的数据变化发现这些便是我们所需要的数据并找到了它循环的规律page所有我们只需用一个for循环就可以将所有的数据得到,再看到pagesize=60得知每页中有60个商品for i in range(0,6000,...原创 2020-01-13 16:38:50 · 1665 阅读 · 0 评论 -
用python创建MySQL
创MySQL之前需要安装pymysql库可以使用 pip install pymysql 直接安装MySQL常用命令1、新增数据opt = "insert into table_name(column1,column2,...,columnN)values(value1,value2,...,valueN)"cursor.execute(opt)2、删除数据opt = "...原创 2019-12-27 14:03:35 · 721 阅读 · 0 评论 -
用python爬取股票网
找到对应的json文件http://50.push2.eastmoney.com/api/qt/clist/get?cb=jQuery1124002312725213714928_1577232380831&pn=’+str(i)+’&pz=20&po=1&np=1&ut=bd1d9ddb04089700cf9c27f6f7426281&fltt=...原创 2019-12-27 13:32:05 · 1712 阅读 · 0 评论 -
用python爬取智联招聘
在智联网站上搜索“大数据分析”F12检索网页,找到对应的json抓取URLimport requestsimport pandas as pd #用于显示数据框import time #时间停留url = r'https://fe-api.zhaopin.com/c/i/sou?_v=0.15071971&x-zp-page-request-id=eb7282843f...原创 2019-12-05 12:42:24 · 2919 阅读 · 7 评论 -
用Python爬取51job保存到CSV
#导入相关import requestsfrom lxml import etreeimport csvdef spider(url_):response = requests.get(url_, headers=headers)response.encoding = ‘gbk’return etree.HTML(response.text)#获取网页内容def download...原创 2019-11-26 13:38:00 · 1594 阅读 · 1 评论