python爬虫(一）

最新推荐文章于 2024-08-06 11:55:39 发布

Franc11s

最新推荐文章于 2024-08-06 11:55:39 发布

阅读量85

点赞数

本文链接：https://blog.csdn.net/weixin_42754630/article/details/99621276

版权

最近工作需要，爬取一个小网站的样式，对css和html不是很精通的我选择用python来爬取网页。

首先我们使用的是urllib包里的requests。这个包是自带的，所以不需要pip install来安装，如果安装会报错误：

"Could not find a version that satisfies the requirement urllib (from versions: ) No matching distribution 		found for urllib"

直接使用：

#导入包
import  urllib.request
#输入要爬取的网页（工作网站不方便放，放一个大佬的网站）
url = r'http://wuchong.me'
#调用一下urlopen这个方法，获得response
res = urllib.request.urlopen(url)
#将响应读取，格式为utf-8
html = res.read().decode('utf-8')
#输出
print(html)

下一步将获取的网页代码存储到为html文件：

import  urllib.request
url = r'http://wuchong.me'
urllib.request.urlretrieve(url,'./v1.html')

之后将源网页里的css样式下载下来放在一个目录下就可以运行了。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Franc11s

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

带你玩转Python爬虫（爬取电影资源篇）

阿玥的小博客

03-16

76万+

跟着我，python你也可以！

Python 爬虫框架Scrapy

Shinersmile的博客

01-09

3814

在scrapy中，会专门定义一个用于记录数据的类，实例化一个对象，利用这个对象来记录数据。每一次，当数据完成记录，它会离开spiders，来到Scrapy Engine（引擎），引擎将它送入Item Pipeline（数据管道）处理。定义这个类的py文件，是items.py。

参与评论您还未登录，请先登录后发表或查看评论

Python爬虫实战：利用代理IP爬取百度翻译

热门推荐

努力让自己发光，对的人才能迎着光而来

08-06

25万+

Python爬虫实战：利用代理IP爬取百度翻译

Python爬虫详解：原理、常用库与实战案例

Why_does_it_work的博客

04-01

7万+

通过本文的讲解，相信读者已经对Python爬虫有了较为全面的认识。爬虫技能在数据分析、自然语言处理等领域具有广泛的应用，希望读者能够动手实践，不断提高自己的技能水平。同时，请注意合法合规地进行爬虫，遵守相关法律法规。祝您学习愉快！

Python爬虫详解（一看就懂）

我的博客

06-21

9万+

爬虫简单的来说就是用程序获取网络上数据这个过程的一种名称。如果要获取网络上数据，我们要给爬虫一个网址（程序中通常叫URL），爬虫发送一个HTTP请求给目标网页的服务器，服务器返回数据给客户端（也就是我们的爬虫），爬虫再进行数据解析、保存等一系列操作。爬虫可以节省我们的时间，比如我要获取豆瓣电影 Top250 榜单，如果不用爬虫，我们要先在浏览器上输入豆瓣电影的 URL ，客户端（浏览器）通过解析查到豆瓣电影网页的服务器的 IP 地址，然后与它建立连接，浏览器再创造一个 HTTP 请求发送给豆瓣电影的服务器，

Python爬虫系列（一）——手把手教你写Python爬虫

cun的博客

10-23

4万+

适合初学者快速上手入门，以爬取CSDN和百度图片为例。

Python爬虫之入门保姆级教程，学不会我去你家刷厕所

小袁同学的博客

05-26

9万+

注重版权，转载请注明原作者和原文链接作者：Bald programmer 今天这个教程采用最简单的爬虫方法，适合小白新手入门，代码不复杂爬虫的介绍以及原理等等七七八八的东西我就不多bb了，咋们直接上教程本案例我就以彼岸图网这个网站做教程，原网址下方链接 https://pic.netbian.com/ 首先打开咋们的网站可以看到有很多好看的图片，一页总共21张图片我们右键选择检查或者直接按F12来到控制台点击左上角的箭头或者快捷键ctrl+shift+c，然后随便点在一张图片上面 ..

python爬虫100例教程 python爬虫实例100例子

dhyuan_88的博客

09-10

3万+

python爬虫100例教程 python爬虫实例100例子涉及主要知识点: web是如何交互的 requests库的get、post函数的应用 response对象的相关函数，属性 python文件的打开，保存代码中给出了注释，并且可以直接运行哦如何安装requests库(安装好python的朋友可以直接参考，没有的，建议先装一哈python环境) windows用户，Linux用户几乎一样: 打开cmd输入以下命令即可，如果python的环境在C盘的目录，会提示权限不够，只需以管

Python 万能代码模版：爬虫代码篇

AI悦创·编程私教1v1

09-14

11万+

你好，我是悦创。很多同学一听到 Python 或编程语言，可能条件反射就会觉得“很难”。但今天的 Python 课程是个例外，因为今天讲的 **Python 技能，不需要你懂计算机原理，也不需要你理解复杂的编程模式。**即使是非开发人员，只要替换链接、文件，就可以轻松完成。并且这些几个实用技巧，简直是 Python 日常帮手的最佳实践。比如：爬取文档，爬表格，爬学习资料；玩转图表，生成数据可视化；批量命名文件，实现自动化办公；批量搞图，加水印、调尺寸。接下来，我们就逐一用 Python 实

python爬虫设计实验

需要远程指导仿真实验、代码有问题的，请后台私信或者关注公众号

07-05

3185

本实验任务主要基于ubuntu完成python对网页的爬取，完成对所需数据的采集。通过完成本实验任务，要求学生掌握python语言对网页数据的采集技能，为以后从事数据采集工程师奠定基础。完成实验实例，python语言爬取小说名字和小说介绍。Ubuntu、Python2.7.12、Tomcat打开获取数据的页面，进行对数据检索分析，找到要获取的数据，构建爬取思路。通过urllib2对页面进行请求，通过BeautifulSoup对请求的页面进行解析。对解析完的数据进行选取，获取重要数据。♥ 知

python爬虫一.zippython爬虫一.zip

02-02

python爬虫一.zippython爬虫一.zippython爬虫一.zippython爬虫一.zippython爬虫一.zippython爬虫一.zippython爬虫一.zippython爬虫一.zippython爬虫一.zippython爬虫一.zip

python爬虫20个案例

03-25

讲诉python爬虫的20个案例。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

81个Python爬虫源代码

12-13

81个Python爬虫源代码，内容包含新闻、视频、中介、招聘、图片资源等网站的爬虫资源

python爬虫：Python 爬虫知识大全

06-22

python爬虫：Python 爬虫知识大全； python爬虫：Python 爬虫知识大全； python爬虫：Python 爬虫知识大全； python爬虫：Python 爬虫知识大全； python爬虫：Python 爬虫知识大全； python爬虫：Python 爬虫知识...

Python爬虫教学视频-最全的Python爬虫视频教程全集

09-12

本Python爬虫教学视频，全集共51天课程，整套课程以Python语言为核心，通过各种经典案例的讲解，很好的演示了python爬虫如何抓取数据的全过程，非常值得Python爬虫工程师和想掌握python爬虫技术的同学借鉴学习。...

numcodecs-0.10.0-cp39-cp39-win_amd64.whl

10-19

numcodecs-0.10.0-cp39-cp39-win_amd64.whl

【BP时序预测】基于雾凇优化算法RIME-BP实现负荷数据预测单输入单输出附matlab代码.rar

10-20

1.版本：matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点：参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象：计算机，电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。替换数据可以直接使用，注释清楚，适合新手

【JCR一区级】Matlab实现北方苍鹰优化算法NGO-CNN-BiLSTM-Attention的故障诊断算法研究.rar