暑假学习python的应用,希望可以让大家作为参考使用,有错的地方请大家指出,以下是本人自己学习的,本人也是大白一枚,如果有个别错误的地方,希望大家见谅
首先我写一下这个暑假,希望自己完成的任务
- python爬取图片
- python爬取视频
- python填写Excel表格
第一个任务python爬取照片
你好!如果你和我一样是都是大白的话建议先学习一下,requests,BeautifulSoup。 如果大家感觉我的这语言风格容易让你接受,可以关注我,看我接下来的推送。可以在评论中留言提问,如果有什么问题可以通过邮箱的形式进行笔者(⊙o⊙)
话不多说我们开始喽!!!!(先给自己(作者)打个气)
介绍:
今天我们的任务是简单的对一个已经有url(网络地址)的图片进行爬取,并保存。这篇文章对你来说,可能会让你学对
1、对python有个了解
2、两个第三方库(requesrts\os)的简单应用
可以利用学到的做些什么呢?
1、爬取只知道url(网络地址)的图片
2、了解部分网站的结构
第一步:建立框架
明确我们的战略目标是我们能打一个胜仗的关键,接下来我们应该明确我们的战斗目标。通过对目标进行向上推,建立我们的任务框架。
1.引入我们所需要的第三方库
2.爬取目标的网站
3.需要爬取的图片对应的代码找到
4.将图片储存在电脑本地
第二步:开始行动了
1.引入我们需要的第三方库,考虑整个过程中我们所需要的第三方库包括requests(获取文本) 、 os(存储文件)
import requests
import os
2.爬取我们的目标网站,我在百度图片中找到了一个小猪猪的图片,进行爬取
我们对里面这只可爱的小猪进行爬取保存
首先我们要找到这只小猪对应的url(网络连接地址啦 高大上一点),建议用谷歌浏览器比较方便,对准照片按鼠标的右键点击检查。
此时会和上面的图片一样出现一些代码,对于我们这些大白来说,完完全全的读懂这些代码是不可能的,咱们只要将这个图片对应的代码找到及可。在图上可以找到是
data_imgurl="https://ss1.bdstatic.com/70cFvXSh_Q1YnxGkpoWK1HF6hhy/it/u=264175563,1523946490&fm=26&gp=0.jpg"
这是这个图片对应的网络链接,到这里你离成功就不远了。
我们也可以对这个代码进行检验,将这个代码直接复制粘贴,看看可不可以出现一张照片呢?
import requests
import os
data_imgurl="https://ss1.bdstatic.com/70cFvXSh_Q1YnxGkpoWK1HF6hhy/it/u=264175563,1523946490&fm=26&gp=0.jpg"
html = requests.get(data_imgurl)
3.马上就是最后一步了,将我们从网站上提取处理的图片以二进制的方式储存在我们的电脑上。
import requests
import os
data_imgurl="https://ss1.bdstatic.com/70cFvXSh_Q1YnxGkpoWK1HF6hhy/it/u=264175563,1523946490&fm=26&gp=0.jpg"
html = requests.get(data_imgurl)
with open('小猪.jpg','wb') as f:
f.write(html.content)
其实通过上面的步骤我们已经将图片储存起来了,但是如果我们想对图片进行修改,地址或者名字可以用os库进行
4.os库介绍
os库可以灵活的对目标进行位置存放,同时对文件的名字进行修改,方便我们对文件进行查找和处理。
import requests
import os
data_imgurl="https://ss1.bdstatic.com/70cFvXSh_Q1YnxGkpoWK1HF6hhy/it/u=264175563,1523946490&fm=26&gp=0.jpg"
html = requests.get(data_imgurl)
root = "D://"
path1 =root+'小猪.jpg'
if not os.path.exists(root):
os.mkdir(root)
if not os.path.exists(path1):
with open(path1,'wb') as f:
f.write(html.content)
大家仔细观察这个代码,自己修改一些地方相信你会有自己想要的收获。
今天的心得:
今天是2020年1月28号,今天鼓捣了一天。看了看mooc视频,在CSDN上看了不少大神的作品,给我的感觉是超赞,我相信我以后也会像大神一样厉害。相信时间是对努力的最好检验,从今天开始每两天推送一篇文章,附带我这两天学习到的,希望可以对大家有些帮助!!!