- 博客(5)
- 收藏
- 关注
原创 分解质因数(python)
#寻找质因数def digui(num): for i in range(2,int(1+num/2)): if num % i == 0: print('%d * '%i,end = '') num = int(num / i) digui(num) if zspd(num) !=1: ...
2019-03-17 11:24:28 886
原创 Ajax加载爬取练习(1)微博爬取
第三天2,Ajax网页练习(仿照崔庆才的微博爬取例子)爬取了杨幂最近300条微博数据import requestsfrom urllib.parse import urlencodefrom pyquery import PyQuery as pqimport sysnon_bmp_map = dict.fromkeys(range(0x10000, sys.maxunicode + ...
2019-01-25 18:09:42 403
原创 豆瓣民谣排行100爬取练习
第三天,学习利用Xpath解析库import requestsimport timefrom lxml import etreedef get_one_page(url): proxies = {"http":"http://61.145.69.27","http":"http://121.61.0.208"} headers = {'User-Agent' : 'Moz...
2019-01-25 13:16:19 192 2
原创 豆瓣图书排行250抓取练习
第二天,利用BeautifulSoup解析库import requestsimport reimport timefrom bs4 import BeautifulSoupdef get_one_page(url): proxies = {"http":"http://61.145.69.27","http":"http://121.61.0.208"} headers...
2019-01-24 19:13:01 352
原创 豆瓣电影TOP250爬取练习
豆瓣电影TOP250爬取刚开始学爬虫,对照着崔庆才的“猫眼TOP100”修改而来,有不对的地方希望大佬指正import requestsimport reimport jsonimport time def get_one_page(url): headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 6.1; Win64; x64...
2019-01-23 18:10:28 348
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人