[Python3]10天突击自学速成Day2：初步查看爬取网页

最新推荐文章于 2021-01-28 20:07:58 发布

NS_Sue27

最新推荐文章于 2021-01-28 20:07:58 发布

阅读量917

点赞数

分类专栏： Python

本文链接：https://blog.csdn.net/NS_Sue27/article/details/95193710

版权

Python 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

1.安装lxml

python3解析库lxml

2.写程序

用lxml解析HTML

1.copy Xpath

通过查找首页推荐文章题目的Xpath，为

//*[@id="mainBox"]/main/div[2]/div[4]/h4/a
//*[@id="mainBox"]/main/div[2]/div[3]/h4/a

......

所以是通过div【】来确定的

import requests
url="https://blog.csdn.net/CSDNedu?utm_source=feed"
r=requests.get(url)
selector=etree.HTML(r.content)
all_li=selector.xpath('//*[@id="mainBox"]/main/div[2]/div/h4/a/text()')
type(all_li)
print(all_li)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

NS_Sue27

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

python项目：利用关键词爬取网络上图片

04-06

python项目：利用关键词爬取网络上图片；python项目：利用关键词爬取网络上图片；python项目：利用关键词爬取网络上图片；python项目：利用关键词爬取网络上图片；python项目：利用关键词爬取网络上图片；python项目...

零基础学Python最快入门教程，10天学完Python基础语法

Python84310366的博客

04-21

382

由于python在人工智能，机器学习，大数据，数据分析，网络爬虫，全方位的技能特点，是非常适合初学者入门和培养编程兴趣的一门语言。相比较其他不少主流编程语言，有更好的可读性，和满足感，因此上手相对容易。今天就教0基础的同学如何用10天时间快速入门和学习Python。

参与评论您还未登录，请先登录后发表或查看评论

7天速成、免费学习，这套Python入门课我收藏了丨资源帖

量子位

07-17

1074

安妮发自凹非寺量子位出品 | 公众号 QbitAI全民雅思正渐渐远去，听说现在全民和全民的补习班已经开始热情拥抱Python了。这种高级编程语言，相比前编程明星C+...

2019最新Python零基础10天进阶班(完结)

z520131499的博客

05-18

1894

1、课程：课程铺垫 2、课程：Python基础（上） 3、课程：python基础（中） 4、课程：python基础（下） 5、课程：python进阶 6、课程：modules packages and programes、Python system、Quiz Python adv 7、课程：面向对象编程 8、课程：Quiz oo、game of life 9、课程：网络数据获取（爬虫实战） 10、...

10天Python基础速学—第一天

m0_46996731的博客

07-13

452

自我介绍自我介绍个人性格个人能力自我介绍大家好，我是物联网专业一名准大二在读生，来自历史悠久的赵王古都—邯郸，是一个没技术，积极向上热爱生活的小白。个人性格我是一个热爱生活的00后男孩，自己担任了十二年的班长，在生活和学习中非常乐观。个人能力 ...

[Python3]10天突击自学速成Day1：Python100例抽取学习+编写2个小程序

NS_Sue27的博客

07-08

1021

1.装Python 2.装Jupyter Notebook 3.学习Python 100例 Python 100例：https://www.runoob.com/python/python-100-examples.html 所给100例子为Python2 ，因此在Python3中有所改动，其中常用如下： print“ ”——>print（“ ”） if x=7——>if ...

python爬虫爬取网页表格数据

09-20

在本例中，我们将重点讨论如何使用Python爬虫来抓取网页中的表格数据。Python提供了多个库来辅助这一过程，如BeautifulSoup和requests，这两个库在上述代码中被广泛使用。首先，`requests`库用于发送HTTP请求并...

Python爬虫：爬取网页内容

06-28

python爬虫案例python爬虫案例python爬虫案例python爬虫案例python爬虫案例python爬虫案例python爬虫案例python爬虫案例python爬虫案例python爬虫案例python爬虫案例python爬虫案例python爬虫案例python爬虫案例...

python作业：爬虫爬取京东评论

07-07

Python作业：爬虫爬取京东评论；Python作业：爬虫爬取京东评论；Python作业：爬虫爬取京东评论；Python作业：爬虫爬取京东评论；Python作业：爬虫爬取京东评论；Python作业：爬虫爬取京东评论；Python作业：爬虫爬取...

python 第一周：学会爬取商品信息

02-26

在“Python第一周：学会爬取商品信息”的学习过程中，我们将深入理解网页的基本构成，并掌握如何使用Python进行网络数据抓取，特别是商品信息的爬取。这个课程将分为几个主要部分，包括课前准备、认识网页的构成、...

Python爬取网页数据

热门推荐

你缺少想象力的博客

08-29

16万+

都说python爬网页数据方便，我们今天就来试试，python爬取数据到底有多方便简介爬取数据，基本都是通过网页的URL得到这个网页的源代码，根据源代码筛选出需要的信息准备 IDE：pyCharm 库：requests、lxml 大概介绍一下，这俩库主要为我们做什么服务的 requests：获取网页源代码 lxml：得到网页源代码中的指定数据言简意赅有没有 ^_^...

Python 获取JavaScript变量，JavaScript转Python

wangjinyu124419的博客

01-28

2378

以百度未登录状态下为例： import js2py import requests from lxml import etree url = 'https://www.baidu.com' headers = { 'Connection': 'keep-alive', 'Cache-Control': 'max-age=0', 'Upgrade-Insecure-Requests': '1', 'User-Agent': 'Mozilla/5.0 (Windows .

Google Chrome找到页面元素的XPath

【欢迎关注公众号：冬瓜白】

05-13

1905

XPath一般来说兼容性比较强。进入开发者工具可以进入Chrome按f12，或者：点击元素选择的箭头，然后选择页面是你需要的元素：粘贴后为：//*[@id="mainBox"]/main/div[2]/div[1]/h4/a这样就可以在代码中使用了。有时候你用火狐浏览器的firePath插件的话，会有html开头的XPath，这个不建议使用，这个是绝对路径，我们一般使用//开头的相对路径。...

[Python3]10天突击自学速成Day4

NS_Sue27的博客

12-13

512

1.安装Mysql 添加环境变量新建： PATH 配置my.ini CMD:mysqld --initialize-insecure --console net start mysql 2.安装navicat https://navicat.com.cn/download/direct-download?product=navicat_premium_cs_x64.exe&...

Python快速学习第十天

至道

08-20

2182

11.1 打开文件 open函数用来打开文件，语法如下： open(name[, mode[, buffering]]) open函数使用一个文件名作为唯一的强制参数，然后返回一个文件对象。模式(mode)和缓冲(buffering)参数都是可选的，我会在后面的内容中对它们进行解释。因此，假设有一个名为somefile.txt的文本文件(可能是用文本编辑器创建的)，其

vtk-9.3.0-cp312-cp312-win_amd64.whl

10-07

vtk-9.3.0-cp312-cp312-win_amd64.whl

基于JavaWeb+Mysql 实现的网上电子购物城项目，实现展示商品、购买商品、提交订单、持久化保存到数据库等基本功能

10-07

【作品名称】：基于JavaWeb+Mysql 实现的网上电子购物城项目，实现展示商品、购买商品、提交订单、持久化保存到数据库等基本功能【适用人群】：适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。【项目介绍】：使用技术 IDE：Eclipse 数据库：MySQL 数据源：C3P0 JDBC 工具：DBUtils 前端框架：Bootstrap Ajax 解决方案：jQuery + JavaScript + JSON + google-gson 快速上手在你的MySQL中创建一个名为estore的数据库（字符编码gb2312），导入使用我提供的estore.sql 使用eclipse导入项目用到的jar包在WEB-INF/lib目录下，记得添加tomcat的jar包，build path即可修改src/c3p0-config.xml中的数据【资源声明】：本资源作为“参考资料”而不是“定制需求”，代码只能作为参考，不能完全复制照搬。需要有一定的基础能够看懂代码，能够自行调试代码并解决报错，能够自行添加功能修改代码。

自由空间中太赫兹脉冲传播的 1D-FDTD 建模Matlab代码.rar

10-07

1.版本：matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点：参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象：计算机，电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。

Mac navicat17-lite 安装包