python爬虫小案例

最新推荐文章于 2024-06-19 17:27:45 发布

BDMJ_Luke

最新推荐文章于 2024-06-19 17:27:45 发布

阅读量402

点赞数

本文链接：https://blog.csdn.net/wanglin317/article/details/80430027

版权

代码：

import requests
from lxml import html
url= 'http://www.testmovie.com' #需要爬数据的网址
page = requests.Session().get(url) 
tree = html.fromstring(page.text) 
result = tree.xpath('//li[@class="test"]//span/text()') #获取需要的数据
print(result)

上面的代码最重要的一行就是最后一行代码。
‘//td[@class=”title”]//a/text()’
//td ：这个相当于指定是大目录；
[@class=”title”]：这个相当于指定的小目录；
//a ：这个相当于最小的目录；
/text()：这个是提取其中的数据。

具体分析：
我们打开一个网站按F12，就可以查看网站的html代码，通过html代码来编写python的最后一行代码：

<li class='movie'>
    <a onclick = 'moreurl(this,(from:'mv_a_1'))' href = 'http://www.testmovie.com/subject/2018020142910-05/4093/?from=showing' class = 'subj'> 魔兽 </a>
</li>

根据上面的html代码，python最后一行代码就应该是：

result = tree.xpath('//li[@class='movie']//a/text()')

下面开始简单介绍写爬虫的步骤。
爬虫前，我们首先简单明确两点：
1. 爬虫的网址；
2. 需要爬取的内容（数据）。
3. 找到合适的框架写python代码
4. 优化爬虫代码

实际项目中，爬虫面临很多问题，比如：
1. 页面规则不统一；
2. 爬下来的数据处理；
3. 反爬虫机制。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

BDMJ_Luke

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

最简单的python爬虫案例，适合入门学习

Yuki1127918的博客

07-08

7803

用python从网页爬取数据，网上相关文章很多，但能让零基础初学者轻松上手的却很少。可能是有的作者觉得有些知识点太简单不值得花费精力讲，结果是难者不会会者不难，初学者常常因此而蒙圈。本人也是小白，刚摸索着爬了两个简单的网页数据，经历了初学者易犯的各种糊涂，特总结分享一下，希望能对小白们有用。python爬网络数据，方法很多。不同的python版本、不同的模块、库，对应代码都不同。所以，在看他人代码时，需要搞清代码环境所用的版本和使用的模块库等信息。因为如果环境不同，相同的代码也可能没用。初学者往往看到一篇文

爬虫小案例：适合Python零基础、对爬虫数据采集感兴趣的同学！

qq_46614154的博客

05-06

859

前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。小的时候心中总有十万个为什么类似的问题，今天带大家爬取一个问答类的网站，本堂课使用正则表达式对文本类的数据进行提取，正则表达式是数据提取的通用方法。适合人群： Python零基础、对爬虫数据采集感兴趣的同学！环境介绍： python 3.6 pycharm ...

参与评论您还未登录，请先登录后发表或查看评论

python爬虫案例-python爬虫详细解析附案例

weixin_37988176的博客

11-01

1989

什么是爬虫框架说这个之前，得先说说什么是框架：是实现业界标准的组件规范：比如众所周知的MVC开发规范提供规范所要求之基础功能的软件产品：比如Django框架就是MVC的开发框架，但它还提供了其他基础功能帮助我们快速开发，比如中间件、认证系统等框架的关注点在于规范二字，好，我们要写的Python爬虫框架规范是什么？很简单，爬虫框架就是对爬虫流程规范的实现，不清楚的朋友可以看上一篇文章谈谈对Pytho...

Python爬虫案例解析：五个实用案例及代码示例（学习爬虫看这一篇文章就够了）

weixin_55154866的博客

11-16

3760

导言： Python爬虫是一种强大的工具，可以帮助我们从网页中抓取数据，并进行各种处理和分析。在本篇博客中，我们将介绍五个实用的Python爬虫案例，并提供相应的代码示例和解析。通过这些案例，读者可以了解如何应用Python爬虫来解决不同的数据获取和处理问题，从而进一步提升爬虫技能。

python爬虫小例子

03-07

爬虫异步加载网页的小例子.

Python爬虫小案例

06-01

Python爬虫小案例-python爬虫案例

09-08

python python爬虫案例 python爬虫案例 python爬虫案例 python爬虫案例 python爬虫案例

Python爬虫小案例《word文档》

最新发布

10-02

Python爬虫小案例《word文档》 Python爬虫小案例Python爬虫小案例 Python爬虫小案例《word文档》 Python爬虫小案例Python爬虫小案例

Python爬虫小案例（word文档）

10-02

Python爬虫小案例（word文档） Python爬虫小案例Python爬虫小案例Python爬虫小案例（word文档）

python 爬虫小案例

weixin_30949361的博客

07-20

105

爬取百度贴吧帖子信息 #!/usr/bin/env python # -*- coding: utf-8 -*- # author: imcati import requests,re,time class TiebaSpider(object): def __init__(self,tiebaName): self.tiebaName=tie...

python爬虫小案例汇总

focuspoints' blog

04-18

1097

python爬虫入门之request模块爬虫爬虫概念爬虫呢，就是编写一个程序去模仿上网过程，让其去互联网上获取数据的过程。爬虫分类爬虫大致分为四种：通用爬虫：爬取整个页面。聚焦爬虫：只爬取页面中你需要的部分内容。增量式爬虫：动态爬取页面，尽可能保证爬到的是新的页面。深度爬虫：这我也不懂。 jupyter安装命令行 pip install jupyter request模块爬...

python爬虫20个案例

03-25

讲诉python爬虫的20个案例。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

Python 爬虫的小案例（男性福利）

Mr_Qian_Ives的博客

07-07

5108

此demo来自某个博客，自己改善了一点代码。而且时间久了不记得URL了，所以没法献上原文URL。（向作者致歉）如果侵权，立马删除。不多bb了直接上成果和源码 import os import random import ssl import time ssl._create_default_https_context = ssl._create_unverified_context import urllib.request import requests from bs4 import Be

Python爬去图片实例,python 爬取图片

aini4568的博客

04-07

# coding:utf-8 import requests import re import time proxies = { "http": "http://124.131.242.155:80" } headers = {'content-type': 'application/json', 'User-Agent': 'Moz...

超级经典的7个Python爬虫小案例（附源码&Python最全资料包）

BlueSocks152的博客

02-01

2227

超级经典的7个Python爬虫小案例（附源码&Python最全资料包）

python爬虫三个小案例（入门）

梧桐下的四叶草

06-17

1740

    爬虫很久没有写了，这次用python来写一波入门教程。有道翻译api接口翻译英文单词这个可以在网上找教程，我是参考如下大神的。传送门这个说是爬虫，但是我个人更觉得像api接口调用。这里面具体就是我输入一个英文单词，然后将单词拼接到api的url上面，之后返回翻译信息。 #!/usr/bin/env python # enco...

python爬虫小案例_从豆瓣爬取《哪吒之魔童降世》的短评

不祈求 ~ ~

09-11

675

python简单爬虫实例

12-29

自动爬取鼠绘上的最新话海贼王漫画如果本地有最新话则退出程序

Python爬虫入门实例：Python7个爬虫小案例（附源码）

Candyz7的博客

06-19

8573

通过本文的讲解，相信读者已经对Python爬虫有了较为全面的认识。爬虫技能在数据分析、自然语言处理等领域具有广泛的应用，希望读者能够动手实践，不断提高自己的技能水平。同时，请注意合法合规地进行爬虫，遵守相关法律法规。祝您学习愉快！