![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
以学为干。
这个作者很懒,什么都没留下…
展开
-
直接通过像素读取图片内容返回结果
【代码】直接通过像素读取图片内容返回结果。原创 2024-01-02 16:07:17 · 450 阅读 · 0 评论 -
python爬虫之requests_html 爬取身份证信息(假的信息)
python爬虫之requests_html 爬取身份证信息(假的信息)直接上源码,粘贴即用import requestsfrom requests_html import HTMLSessionsession = HTMLSession()def huoqu():session = HTMLSession()for url in listlink():r = session.get(url)for i in range(1,16):name = r.html.xpath("//tabl原创 2021-03-18 16:09:43 · 1000 阅读 · 0 评论 -
单独下载西瓜视频
单独代码```pythonimport reimport requestsimport randomfrom zlib import crc32from base64 import b64decodeheaders = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTHL, like Gecko) Chrome/66.0.3359.181 Safari/537.36"翻译 2020-06-19 10:44:41 · 1250 阅读 · 0 评论 -
有道翻译 python 翻译
有道翻译 中英互译 方便自己查询,不必打开网页和软件直接上源码import requestsdef Youdao():url = ‘http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule’fanyi=input(’-------------------------请输入要翻译的文本!------...原创 2019-12-06 13:52:58 · 177 阅读 · 0 评论 -
爬取完美网的title 和 每个title的详情信息 并且保存到excel表格
from requests_html import HTMLSession#必须使用session = HTMLSession()session = HTMLSession()import xlwtimport reimport timexls = xlwt.Workbook()sht1 = xls.add_sheet(‘Sheet1’)def guolv(src):#过滤地址ur...原创 2019-05-24 14:45:54 · 612 阅读 · 0 评论 -
requests_html爬取表情包
```#进行爬取https://fabiaoqing.com/biaoqingimport requestsimport osfrom requests_html import HTMLSession#必须使用session = HTMLSession()session = HTMLSession()os.makedirs('C:/表情包',exist_ok=True)path='C...原创 2019-05-28 12:39:17 · 705 阅读 · 0 评论 -
多线程爬取高清壁纸图片
直接上源码import requestsfrom lxml import etreeimport osimport reimport timefrom threading import Threaddef gaoqing(src): string=src pattern=re.compile(r'(.*?)\?',re.S) gqsrc = re.findal...原创 2019-08-16 18:09:31 · 318 阅读 · 0 评论 -
爬虫下载壁纸
import requestsfrom requests_html import HTMLSession,HTMLimport osimport reimport randomfrom threading import Threado=0headers={ 'user-agent':'Mozilla/5.0'}def html(string): pattern = r...原创 2019-08-29 16:07:24 · 307 阅读 · 0 评论