python爬虫简单实用系列
文章平均质量分 79
简单入门,确定不来看看嘛???
xiao_fan_#
这个作者很懒,什么都没留下…
展开
-
利用python将喜欢的csdn文章保存成pdf
前言: 收藏了多年的csdn免费文章,忽然收费或者突然被作者删除了怎么办? 文章目录前言:1. 工具1.1需要使用到的模块:1.2 需要安装的工具2. 获得文章内容的html(去除相无关内容)3. 将获得的html转成pdf 1. 工具 1.1需要使用到的模块: pdfkit,requests,parsel,os,time 1.2 需要安装的工具 链接:https://pan.baidu.com/s/1e_0_4tpyxIU8lHqJF56BhA 提取码:2141 直接傻瓜式的默认安装即可 2. 获得文原创 2020-08-15 23:50:29 · 3107 阅读 · 19 评论 -
简单爬取小姐姐的照片
使用环境 win10系统,python 先简单开始访问,获取html从而提取所需数据 import requests url = 'https://www.douyu.com/g_yz' response = requests.get(url=url) html = response.text print(html) 将输出结果往下拉,指导看到jpg相关的如下图所示 接着就利用简单的正则表达式进行提取 import re title_url = re.findall(r'"rn":"(.*?)","rpo原创 2020-08-14 17:21:01 · 1519 阅读 · 0 评论 -
简单将喜欢的博客做成pdf
使用工具 开发工具IDEA 需要安装模块pdfkit,request,parsel,以及wkhtmltox-0.12.5-1.msvc2015-win64工具 进行分析某博客的源代码分析获得里面所需的内容的html 紧接着利用parsel模块进行筛选从而获得需要获得目标的相关内容 标准的html格式 接着将获得body体与标准的html结构进行拼接 便会在该目录下得到一个html ...原创 2020-08-14 00:59:24 · 346 阅读 · 0 评论