Python 应用
文章平均质量分 88
Python 代码的实际应用
mycsdn5698
这个作者很懒,什么都没留下…
展开
-
用 Python 爬取网页 PDF 和文档
找到输入框对应的标签,根据 class name 进行内容清楚和输入(如果标签有 id 属性可以根据 id 进行输入框确定),代码如下。注意:ANSI 编码的文本在 kindle 打开会有部分乱码,UTF-8 编码的不会。缺点:str(news_context) 的使用导致 div 标签出现,且。获取标签的某个属性,例如 a 标签的 href 属性,代码如下。如果标签属性较少,则可以使用正则提取,例子及其代码如下。,可以免费查看部分资料,全部资料的话是收费的。除了上述两个作为例子的网站,还有。原创 2023-10-02 22:00:14 · 5753 阅读 · 3 评论 -
用 Python 爬取网页小说
(5)将提取内容存入 TXT 文档中,其中需要注意存放章节内容时,第一个 p 标签内容为广告,需要跳过(所有的 p 标签内容按顺序存入 context 数组中,context 长度等于 p 标签个数)(4)查看各章节间的跳转关系,最后一章的下一章是列表页面。(1)查看网页编码格式,在 head 标签里能找到。的 div 中的 h1 标签里,采用正则提取。的 div 中的 p 标签里,采用正则提取。章节名存放在 class 为。(3)查看章节内容存放位置。章节内容存放在 id 为。(2)查看章节名存放位置。原创 2023-10-01 16:23:27 · 732 阅读 · 0 评论 -
用 Python 爬取网页漫画
(3)解压之后,将 chromedriver.exe 放入 Python 的安装目录下(如果有安装 anaconda,就放入到 anaconda 的安装目录下,运行代码时使用 anaconda 自带的命令行))中去下载,以版本为 116.0.5845.187 的浏览器为例,下载 win32 的 chromedriver(Windows 系统使用 win32 的没有问题,win64 不确定)(2)下载对应版本的 ChromeDriver,大部分用的都是最新版的 Chrome,就要从这个链接(原创 2023-09-12 22:28:46 · 909 阅读 · 0 评论