Python 爬虫笔记（1）

最新推荐文章于 2024-09-17 23:15:58 发布

Hearthougan

最新推荐文章于 2024-09-17 23:15:58 发布

阅读量820

点赞数

文章标签： python 爬虫

本文链接：https://blog.csdn.net/hearthougan/article/details/68240541

版权

import urllib.request

访问网址，打开网页，方法：

urllib.request.urlopen(url,data=None, [timeout, ]*, cafile=None, capath=None,cadefault=False, context=None)

其中url,可以是一个字符串string（也就是网址），也可以是一个Request对象

方法一：

response = urllib.request.urlopen("http://www.baidu.com")

html = response.read()
html = html.dcode("utf-8")/#按照网页代码，整齐显示
print(html)

方法二：

req = urllib.request.Request("http://www.baidu.com")
response = urllib.request.urlopen(req)
html = response.read()
print(html)

方法一，会把网址首先转化为一个对象，也就是方法二，然后，对对象进行访问。

下载一只猫，网址：http://placekitten.com

req = urllib.request.Request("http://placekitten.com/g/500_600")
response = urllib.request.urlopen(req)
cat_img = response.read()

with open('cat_img_500_600.jpg', 'wb') as f:
     f.write(cat_img)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Hearthougan

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Python爬虫随笔1

墨

09-07

340

起因问答网站做到现在，没有数据啊，所以需要一些数据；爬虫很好玩，早就在知乎看见别人爬各种羞羞网站的代码，不过一直没时间，最近感觉自己秋招也没啥希望，还是做点自己想做的事情吧；我的Python基础几乎为0，虽然看过语法，然而都忘了，这玩意不写，两天就忘了；所以给点动力，也可以好好工作一把；爬虫1.一直听说爬虫，其实并不是什么厉害的东西；在B/S架构下，所有数据都是要传输到我们客户端上的，也就是

Python爬取图片2

FANtastic_Y的博客

10-27

165

import requests def geturl(url): kv = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36' } r=requests.g...

参与评论您还未登录，请先登录后发表或查看评论

python爬虫零基础入门（一）三行代码下载图片

qq_42680814的博客

12-23

201

爬取访问网站的小问题，代码如下import urllib.request response=urllib.request.urlopen("https://www.pexels....

保存图片

qq_21466587的博客

07-04

462

import urllib.request response=urllib.request.urlopen("http://placekitten.com/g/500/600") cat_img=response.read() with open('cat_500_600.jpg','wb') as f: f.write(cat_img)

百度百科中关于fwrite的用法说明

涂作权的博客

07-16

1342

size_t fwrite(const void* buffer, size_t size, size_t count, FILE* stream); 注意：这个函数以二进制形式对文件进行操作，不局限于文本文件返回值：返回实际写入的数据块数目（1）buffer：是一个指针，对fwrite来说，是要获取数据的地址；（2）size：要写入内容的单字节数；（3）count:要进行写入s

python 爬虫学习笔记

03-09

Python 爬虫学习笔记本文将详细介绍 Python 爬虫学习笔记的知识点，涵盖爬虫基础、网络和前端基础、Requests 模块、请求头、GET 和 POST 请求、代理、Cookie 模拟登录、Quote 和 Unquote、登录和获取 Cookie、Post...

python爬虫笔记.zip

01-04

Python是一种解释型的、面向对象的、带有动态语义的高级程序设计语言。它是由荷兰人吉多·罗萨姆于1989年发布的，第一个公开发行版发行于1991年。Python注重解决问题的方法，而不是语法和结构。它被广泛应用于各个...

Python爬虫笔记！！！

03-10

"Python爬虫笔记" Python爬虫笔记是指使用Python语言来实现网络爬虫程序的技术笔记。爬虫程序可以模拟人类请求网站行为，自动请求网页、抓取数据，并使用一定的规则提取有价值的数据。爬虫的实际例子包括搜索引擎...

python爬虫学习笔记-scrapy框架(1)

01-29

python爬虫学习笔记-scrapy框架(1) python scrapy 爬虫 python爬虫学习笔记-scrapy框架(1) python scrapy 爬虫 python爬虫学习笔记-scrapy框架(1) python scrapy 爬虫 python爬虫学习笔记-scrapy框架(1) python ...

Python爬虫笔记1-爬虫背景了解

05-29

好的，你的第一个问题是关于 Python 爬虫笔记的。Python 爬虫是一种自动化程序，它可以模拟浏览器行为，从网页中获取所需的信息。这些信息可以是文本、图片、视频等。爬虫通常用于数据采集、搜索引擎优化、数据挖掘...

爬取一张图片

FANtastic_Y的博客

10-27

371

import requests url='http://placekitten.com/g/500/600' r=requests.get(url) cat_img=r.content with open('cat_500_600.jpg','wb')as f: f.write(cat_img)

python下载图片的代码块

aici0819的博客

05-04

108

import urllib.requestimgurl="https://ss3.baidu.com/9fo3dSag_xI4khGko9WTAnF6hhy/image/h%3D300/sign=84337ed7c7134954611eee64664f92dd/ac6eddc451da81cbe337459b5e66d01608243197.jpg"response = urllib.r...

python——爬虫基础

qq_41440031的博客

08-10

134

一在placekitten上面下载一只猫咪图片 import urllib.request response = urllib.request.urlopen("http://placekitten.com/g/300/600") cat_img = response.read() with open('cat_500_600.jpg','wb') as f: f.write(cat_img) 或者 import urllib.request #先获取一个request对.

Python学习笔记（二十七）——爬虫一

qq_33613232的博客

02-02

261

0、从网上下载一张猫的图片 import urllib.request response = urllib.request.urlopen('http://placekitten.com/200/300') cat_img = response.read() with open('cat_200_300.jpg','wb') as f: f.write(cat_img) 1、...

python 如何下载保存图片_下载并保存图片Python2.7

weixin_30040925的博客

02-03

239

#!/usr/bin/env python# -*- encoding: utf-8 -*-import urllib2import osdef save_img(img_url,file_name,file_path='img'):#保存图片到磁盘文件夹 file_path中，默认为当前脚本运行目录下的 bookimg文件夹try:if not os.path.exists(file_path)...

Python办公自动化案例（二）：对比两个Excel数据内容并标出不同

衍生星球的博客

09-14

576

在数据处理和分析的日常工作中，我们经常需要比较两个Excel文件的差异。这可能是为了验证数据的一致性、检查数据的准确性，或者在版本控制中追踪更改。手动比较这些文件不仅耗时，而且容易出错。幸运的是，Python的openpyxl库提供了一种自动化这一过程的方法。

[Python数据可视化]Plotly Express: 地图数据可视化的魅力

最新发布

William数据分析的博客

09-17

886

在数据分析和可视化的世界中，地图数据可视化是一个强大而直观的工具，它可以帮助我们更好地理解和解释地理数据。Python 的 Plotly Express 库提供了一个简单而强大的方式来创建各种地图。本文将通过一个简单的示例，展示如何使用 Plotly Express 来创建一个交互式的地图，并探讨其在地图数据可视化方面的应用。

Tcl lnit error: Can’t find a usable init.tcl in the following directories 问题解决

梦想闹钟

09-15

541

实际研究后发现，其实py2exe已经把打包需要的lib放在dist文件夹下了，但是打包后的程序运行后却没有去lib下找，而是去找系统自带的环境变量里找，所以找不到。这个问题出现在我用py2exe打包了一个包含tkinter的图形化界面，在当前电脑上运行无问题，在移动到新电脑上后提示报错、getcwd用于获取当前工作目录绝对路径，在设置环境的变量的时候它用的是绝对路径-所以也导致了在当前电脑上能用而移动后不能用。解决方法是在你的程序里重新设置下环境变量，而且是用相对路径的形式。

Java企业面试题3

m0_74972727的博客

09-15

833

1. break和continue的作用(智*图) break：用于完全退出一个循环（如 for, while）或一个 switch 语句。当在循环体内遇到break语句时，程序会立即跳出当前循环体，继续执行循环之后的代码。 continue：用于跳过当前循环体中剩余的部分，并开始下一次循环。如果是在 for 循环中使用continue，则会直接进行条件判断以决定是否执行下一轮循环。 2. if分支语句和switch分支语句的异同之处(智*图) 相同点：都是用来根据不同的条件执行不同的代码块。