练习
那些年错过的东西
不要小看自己所学的东西
展开
-
git的简单应用,指令
git 一些常用指令原创 2023-02-18 15:43:02 · 66 阅读 · 0 评论 -
scrapy下的分布式爬取
分布式爬虫部署,练习原创 2022-07-18 23:34:32 · 102 阅读 · 0 评论 -
scrapy使用cookie小测试
这里是scrapy,spider代码import scrapyfrom boos.items import BoosItemclass BoosSpiderSpider(scrapy.Spider): name = 'boos_spider' allowed_domains = ['www.zhipin.com'] start_urls = ["https://www.zhipin.com/c101280100/?query=python%E7%88%AC%E8%9原创 2022-05-20 22:47:59 · 129 阅读 · 0 评论 -
pyhton爬虫(简单过字体加密)
1. 找到反爬内容确定字体存放位置定位到正则匹配import refrom fontTools.ttLib import TTFontimport requestsheaders = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.54 Safari/537.36 Edg/101.0.1210.39原创 2022-05-15 21:07:14 · 560 阅读 · 0 评论 -
BeautifulSoup简单应用(python爬虫)
打开cmd安装pip install beautifulsoup4根据属性定位server=soup.find(attrs={'id':'hao123-govsite'})定位server下的a标签a=server.a获取a标签的中的href和文字text=a.texttext=a['href']根据属性定位div下的所有a标签a=soup.find_all(attrs={'class':'g-gc'})import requestsfrom bs4 import B.原创 2022-05-10 00:28:14 · 339 阅读 · 0 评论 -
python爬虫进阶(MD5)
找到加密参数pwd: e10adc3949ba59abbe56e057f20f883e根据参数pwd进行搜索定位加密方法点击进入,进行定位调试,如下点击md5进入在这里可以看到md5的加密方法啥的,然后就是找个环境扣下来运行,大概运行情况如下,结果可以看到其实和调用hashlib库得到的加密是一样的以后遇到这种就直接使用第二个方法简单快捷就不用去逆向了侵权立删...原创 2022-05-07 20:19:51 · 1046 阅读 · 0 评论