python3抓取php,python3 实现抓取糗事百科的内容

最新推荐文章于 2022-12-30 21:24:31 发布

撸铁活力蓝

最新推荐文章于 2022-12-30 21:24:31 发布

阅读量97

点赞数

文章标签： python3抓取php

# 抓取糗事百科的内容

import requests

from lxml import etree

class Qiushi() :

def __init__(self) :

self.url = 'http://www.qiushibaike.com/8hr/page/{}';

self.headers = {

"User-Agent":"Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1 Trident/5.0;"

};

def parse_url(self , url) :

response = requests.get(url , timeout = 10 , headers = self.headers)

assert response.status_code == 200

print(url)

return etree.HTML(response.text)

def parse_content(self , html) :

item = html.xpath('//div[@class="recommend-article"]/ul/li')

print(item)

for i in item :

# 内容

print(i.xpath('./div/a[@class="recmd-content"]/text()'));

# 好笑数

print(i.xpath('./div/div[@class="recmd-detail clearfix"]/div/span[1]/text()'))

# 评论数

print(i.xpath('./div/div[@class="recmd-detail clearfix"]/div/span[4]/text()'))

# 用户名

print(i.xpath('./div/div[@class="recmd-detail clearfix"]/a/span/text()'))

# 头像地址

print(i.xpath('./div/div[@class="recmd-detail clearfix"]/a/img/@src'))

def run(self) :

url = self.url.format(1);

html = self.parse_url(url);

self.parse_content(html);

if __name__ == '__main__':

qiu = Qiushi();

qiu.run();

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

撸铁活力蓝

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python3抓取php,python3 实现抓取糗事百科的内容

# 抓取糗事百科的内容import requestsfrom lxml import etreeclass Qiushi() :def __init__(self) :self.url = 'http://www.qiushibaike.com/8hr/page/{}';self.headers = {"User-Agent":"Mozilla/5.0 (compatible; MSIE 9.0;...
复制链接

扫一扫

selenium+python打开一个网站

98年的老阿姨

02-01

326

下载谷歌驱动 chromedriver.exe(要与浏览器版本相对应) 下载地址：https://npm.taobao.org/mirrors/chromedriver/ from selenium import webdriver from selenium.webdriver.common.keys import Keys import time '''1.创建有界面的浏览器对象、窗口最大化、刷新页面''' def create_driver(): # 1.1打开浏览器页面 dr.

爬虫学习05

CL5221的博客

05-27

497

研究生自学python爬虫

参与评论您还未登录，请先登录后发表或查看评论

【撸网站第一天】开篇

热门推荐

xingxingzhilong的专栏

12-14

20万+

今天准备撸一个网站，主要撸一下他的技术点，包括：前端、结构、后端、压力测试等等。现介绍一下这个网站：http://xingship.com 测试下来，这个网站貌似只能在手机上使用，我在pc上显示的效果并不是很好，不知道站长是否可以兼容一下pc端。如下效果：很丑，但是当我跑到手机上来看的时候，还像那么回事。网站呢，主要是电影短视频的介绍。开始我以为这个是网站的布局是这一个标准的网格布局，但是其实他是个瀑布模式。第二篇，我们来详细介绍这个，好啦，今天由于时间关系，就现记录到这..

python爬取电影网站存储于数据库_python爬虫猫眼电影和电影天堂数据csv和mysql存储过程解析...

weixin_39558754的博客

12-11

2120

字符串常用方法# 去掉左右空格'hello world'.strip() # 'hello world'# 按指定字符切割'hello world'.split(' ') # ['hello','world']# 替换指定字符串'hello world'.replace(' ','#') # 'hello#world'csv模块作用：将爬取的数据存放到本地的csv文件中使用流程导入模块打开csv...

url.format()

莲君

01-14

8201

url.format()生成一个url

使用 Python 进行网页抓取

前端好玩的小案例、游戏、工具

12-30

3万+

面对铺天盖地的大数据，怎样才能快速发现其中的趋势、找到数据走势，从而改变工作模式，这是摆在数据工作者面前的难题。如果您知道如何做到这一点，那么对于企业和个人使用来说，网络抓取似乎是一种非常有用的节省时间的工具。我们将重点介绍为什么您应该使用 Python 进行网页抓取，并为您提供有关如何完成它的快速教程，包括使用哪些Python 开发工具。因此，下一步是部署抓取程序，将信息复制到您请求的数据库中。要获得您希望抓取为Python友好格式的信息，您需要使用执行HTTP请求的Python包。

Python 爬虫（抓取网页内容简单实现）

weixin_45708589的博客

04-10

2万+

1. 首先第一步我们先找到自己抓取的网站网址以及内容在这里我使用的是https://m.douban.com/group/729027/ 抓取的内容是这个网页下的：所有的讨论 2. 对这个网页的html进行解析，找到讨论这一栏的html源码使用F12对当前页面进行解析：点击圈起来的部分后，点击讨论中的 “婉卿......” 右边就能自动跳转到这一句的源码了右键单击源码后点击复制中的复制selector 复制出来的是：#group-topics > div:nt...

Python3抓取天气数据并分析天气

06-18

安装Python并添加到环境变量，pip安装需要的相关模块即可。 pyecharts模块安装时请依次执行以下命令： pip install echarts-countries-pypkg pip install echarts-china-provinces-pypkg pip install echarts-...

python爬虫项目——自动批量抓取m3u8网页视频

10-14

总的来说，这个Python爬虫项目展示了如何结合网络请求、HTML解析、文件下载和多媒体处理等技术，实现自动抓取和合成m3u8网页视频。通过学习和实践此类项目，开发者不仅可以提升自己的Python编程能力，还能深入理解...

python3实现抓取网页资源的 N 种方法

12-24

这两天学习了python3实现抓取网页资源的方法，发现了很多种方法，所以，今天添加一点小笔记。 1、最简单 import urllib.request response = urllib.request.urlopen('http://python.org/') html = response.read()...

基于python3抓取pinpoint应用信息入库

12-23

这篇文章主要介绍了基于python3抓取pinpoint应用信息入库,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 Pinpoint是用Java编写的大型分布式系统的APM（应用...

python爬虫爬取糗事百科内容

11-17

糗事百科的爬虫，是主要用来介绍爬虫的一些基本知识，方便大家爬取简单的糗事百科的内容，利用的是beautifulsoup

python中format函数用法简书_Python格式化字符串format

weixin_39766258的博客

11-27

227

0. 测试环境Python 3.6.91. 引言Python中格式化字符串的方式有，一种是用%操作符来进行字符串格式化，一种是使用str.format()来进行字符串格式化，本文主要介绍str.format()方式，这种方式更主流，也是官方推荐的方式，%的方式后面会逐渐淘汰。2. 格式化字符串2.1 基本语法格式化字符串包含用大括号{}括起来的“替换字段”，。大括号中不包含的内容被视为正常文本，会...

51浅析建设工程全过程造价管理.docx

09-12

51浅析建设工程全过程造价管理

31工程量清单计价模式下的造价控制与管理.docx

09-12

31工程量清单计价模式下的造价控制与管理

Java毕业设计基于SSM+mysql的学生宿舍管理系统源码+数据库（高分代码）

09-12

Java毕业设计基于SSM+mysql的学生宿舍管理系统源码+数据库（高分代码），含有代码注释，新手也可看懂。毕业设计、期末大作业、课程设计、高分必看，下载下来，简单部署，就可以使用。包含：项目源码、数据库脚本等，该项目可以作为毕设、课程设计使用，前后端代码都在里面。该系统功能完善、界面美观、操作简单、功能齐全、管理便捷，具有很高的实际应用价值。项目都经过严格调试，确保可以运行！可以放心下载。 Java毕业设计基于SSM+mysql的学生宿舍管理系统源码+数据库（高分代码），含有代码注释，新手也可看懂。毕业设计、期末大作业、课程设计、高分必看，下载下来，简单部署，就可以使用。包含：项目源码、数据库脚本等，该项目可以作为毕设、课程设计使用，前后端代码都在里面。该系统功能完善、界面美观、操作简单、功能齐全、管理便捷，具有很高的实际应用价值。项目都经过严格调试，确保可以运行！可以放心下载。 Java毕业设计基于SSM+mysql的学生宿舍管理系统源码+数据库（高分代码），含有代码注释，新手也可看懂。毕业设计、期末大作业、课程设计、高分必看，下载下来，简单部署，就可以使用。包含：项目

c++课程设计-个人收支管理系统.zip

09-12

1、资源项目源码均已通过严格测试验证，保证能够正常运行； 2、项目问题、技术讨论，可以给博主私信或留言，博主看到后会第一时间与您进行沟通； 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用，尤其对于人工智能、计算机科学与技术等相关专业，更为适合； 4、下载使用后，可先查看README.md文件（如有），本项目仅用作交流学习参考，请切勿用于商业用途。1、资源项目源码均已通过严格测试验证，保证能够正常运行； 2、项目问题、技术讨论，可以给博主私信或留言，博主看到后会第一时间与您进行沟通； 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用，尤其对于人工智能、计算机科学与技术等相关专业，更为适合； 4、下载使用后，可先查看README.md文件（如有），本项目仅用作交流学习参考，请切勿用于商业用途。1、资源项目源码均已通过严格测试验证，保证能够正常运行； 2、项目问题、技术讨论，可以给博主私信或留言，博主看到后会第一时间与您进行沟通； 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用，尤其对于人工智能、计算机科学与技术等相关专业，更为适合； 4、下载使用后，可先查看README.md文件（如有），本项目仅用作交流学习参考，请切勿用于商业用途。1、资源项目源码均已通过严格测试验证，保证能够正常运行； 2、项目问题、技术讨论，可以给博主私信或留言，博主看到后会第一时间与您进行沟通； 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用，尤其对于人工智能、计算机科学与技术等相关专业，更为适合； 4、下载使用后，可先查看README.md文件（如有），本项目仅用作交流学习参考，请切勿用于商业用途。1、资源项目源码均已通过严格测试验证，保证能够正常运行； 2、项目问题、技术讨论，可以给博主私信或留言，博主看到后会第一时间与您进行沟通； 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用，尤其对于人工智能、计算机科学与技术等相关专业，更为适合； 4、下载使用后，可先查看README.md文件（如有），本项目仅用作交流学习参考，请切勿用于商业用途。1、资源项目源码均已通过严格测试验证，保证能够正常运行； 2、项目问题、技术讨论，可以给博主私信或留言，博主看到后会第一时间与您进行沟通； 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用，尤其对于人工智能、计算机科学与技术等相关专业，更为适合； 4、下载使用后，可先查看README.md文件（如有），本项目仅用作交流学习参考，请切勿用于商业用途。1、资源项目源码均已通过严格测试验证，保证能够正常运行； 2、项目问题、技术讨论，可以给博主私信或留言，博主看到后会第一时间与您进行沟通； 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用，尤其对于人工智能、计算机科学与技术等相关专业，更为适合； 4、下载使用后，可先查看README.md文件（如有），本项目仅用作交流学习参考，请切勿用于商业用途。

js逆向-安某客空间推理验证码验证流程分析

09-12

js逆向-安某客空间推理验证码验证流程分析

ssm+mysql的在线汽车交易系统(源码+lw+ppt)

python3抓取php,python3 实现 抓取 糗事百科 的内容

python3抓取php,python3 实现抓取糗事百科的内容