python下载图片、已知url_python小练——下载指定url中的图片

最新推荐文章于 2022-10-24 17:33:43 发布

weixin_39747975

最新推荐文章于 2022-10-24 17:33:43 发布

阅读量101

点赞数

文章标签： python下载图片、已知url

#coding=gbk

#download pictures of the url

#useage: python downpicture.py www.baidu.com

import os

import sys

from html.parser import HTMLParser

from urllib.request import urlopen

from urllib.parse import urlparse

def getpicname(path):

''' retrive filename of url '''

if os.path.splitext(path)[1] == '':

return None

pr=urlparse(path)

path='http://'+pr[1]+pr[2]

return os.path.split(path)[1]

def saveimgto(path, urls):

'''

save img of url to local path

'''

if not os.path.isdir(path):

print('path is invalid')

sys.exit()

else:

for url in urls:

of=open(os.path.join(path, getpicname(url)), 'w+b')

q=urlopen(url)

of.write(q.read())

q.close()

of.close()

class myhtmlparser(HTMLParser):

'''put all src of img into urls'''

def __init__(self):

HTMLParser.__init__(self)

self.urls=list()

self.num=0

def handle_starttag(self, tag, attr):

if tag.lower() == 'img':

srcs=[u[1] for u in attr if u[0].lower() == 'src']

self.urls.extend(srcs)

self.num = self.num+1

if __name__ == '__main__':

url=sys.argv[1]

if not url.startswith('http://'):

url='http://' + sys.argv[1]

parseresult=urlparse(url)

domain='http://' + parseresult[1]

q=urlopen(url)

content=q.read().decode('utf-8', 'ignore')

q.close()

myparser=myhtmlparser()

myparser.feed(content)

for u in myparser.urls:

if (u.startswith('//')):

myparser.urls[myparser.urls.index(u)]= 'http:'+u

elif u.startswith('/'):

myparser.urls[myparser.urls.index(u)]= domain+u

saveimgto(r'D:\python\song', myparser.urls)

print('num of download pictures is {}'.format(myparser.num))

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39747975

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

（九）python网络爬虫（理论+实战）——爬虫实战：指定关键词的百度新闻爬取

c1007857613的专栏

02-21

9326

本节主要是介绍了如何编写一个爬虫项目来实现指定关键词的百度新闻爬取，并进一步巩固用正则表达式来解析爬取的数据。巩固正则表达式的规则和常用的方法，掌握正则表达式在实际爬虫项目中的应用。

Python内置函数slice()——《Python内置函数手册》Python老吕编著

最新发布

Python老吕的博客

08-21

slice()函数是 Python 中的一个内置函数，用于创建切片对象。这个函数非常灵活，可以接受不同的参数来定义切片的起始、结束和步长。slice()函数的返回值是一个slice对象，该对象可以被用来获取序列的特定部分。使用slice()动态性：可以在运行时根据需要创建切片，增加了代码的灵活性。可读性：使用slice()可以提高代码的可读性，尤其是当涉及到复杂的切片操作时。重用性：创建的slice对象可以在不同的上下文中重复使用。slice()

参与评论您还未登录，请先登录后发表或查看评论

python下载url图片或文件

JC8549的博客

03-30

4121

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、Get方法二、urllib方法三、可能遇到的问题1、urllib.error.HTTPError: HTTP Error 403: Forbidden总结前言 python 网页下载url链接图片or文件一、Get方法 import requests def download_img(img_url, api_token): print (img_url) header = {"Authorizat.

用Python抓网页上的图片

青年人，应该做怎样的青年人

02-04

135

用Python做这类事情简直太爽了，重发一个老的代码，可指定网址下载里面的图片 [code]# -*- coding: utf-8 -*- """ some function by metaphy,2007-04-03,copyleft version 0.2 """ import urllib, httplib, urlparse import re import rando...

python下载图片、已知url_Python下载指定页面上图片的方法

weixin_39942488的博客

11-23

177

#!/usr/bin/python#coding:utf8import reimport urllibdef getHtml(url):page = urllib.urlopen(url)html = page.read()return htmldef getImg(html):reg = r'src="(.*?\.jpg)" ' imgre = re.compile(reg) imglist...

python下载图片、已知url_根据url下载图片？

weixin_39716921的博客

11-23

406

根据url图片下载不下来，这些url是要下载ImageNet数据集里的数据，图片都是国外的是，所以连接超级慢，有一些图片已经丢失了。想问一下该怎么下载才能尽可能把图片又好又快的下载到我的电脑我的代码importurllib.requestpath="G:\\grabage_pragram\\ImageNet"read_path=path+"\\"+"newspaper.txt"down_url=...

python小练——下载指定url中的图片

weixin_30670151的博客

08-19

139

python小练——下载指定url中的图片 #coding=gbk#download pictures of the url#useage: python downpicture.py www.baidu.comimport osimport sysfrom html.parser import HTMLParserfrom urllib.re...

python下载保存_python下载图片并保存到文件夹

weixin_39622562的博客

01-29

1811

从网络下载图片并保存到磁盘文件中建立保存图片的目录如果目录不存在，则建立文件目录。使用os.makedirs(file_path)建立目录，而不是使用os.mkdir(file_path)。因为mkdir只能建立单级文件目录。makedirs则能建立多级文件目录，也能建立单级文件目录。单级文件目录：img多级文件目录：my/book/img获得图片名(包含路径)从图片url中取得图片后缀——jgp...

PyPI 官网下载 | atlassian-python-api-1.14.5.tar.gz

01-09

《PyPI官网下载 | atlassian-python-api-1.14.5.tar.gz——探索Atlassian Python API库》在Python的开发过程中，我们经常会利用各种第三方库来扩展其功能，提高开发效率。其中，`atlassian-python-api`是针对...

PyPI 官网下载 | tencentcloud-sdk-python-ocr-3.0.273.tar.gz

01-16

本文将详细介绍从PyPI官网下载的资源——tencentcloud-sdk-python-ocr-3.0.273.tar.gz，这是一个专门用于处理腾讯云OCR（Optical Character Recognition）服务的Python库。 1. **PyPI（Python Package Index）**： ...

python下载图片、已知url_python下载图片实现方法(超简单)

weixin_39850599的博客

11-20

376

我们有时候会需要在网上查找并下载图片，当数量比较少的时候，点击右键保存，很轻松就可以实现图片的下载，但是有些图片进行了特殊设置，点击右键没有显示保存选项，或者需要下载很多图片，这样的情况，写一段Python爬虫代码就可以轻松解决!一、页面抓取#coding=utf-8import urllibdef getHtml(url):page = urllib.urlopen(url)html = pag...

python爬虫怎么下载图片到手机_Python爬虫获取图片并下载保存至本地

weixin_39774644的博客

11-28

196

这篇文章主要介绍了关于Python爬虫获取图片并下载保存至本地，有着一定的参考价值，现在分享给大家，有需要的朋友可以参考一下1、抓取煎蛋网上的图片。2、代码如下：import urllib.requestimport os#to open the urldef url_open(url):req=urllib.request.Request(url)req.add_header('User-Age...

python图片怎么下载到手机_Python下载图片并保存本地的两种方式

weixin_39653761的博客

12-09

317

一：使用Python中的urllib类中的urlretrieve()函数，直接从网上下载资源到本地，具体代码：import os,stat import urllib.request img_url="https://timgsa.baidu.com/timg?image&quality=80&size=b9999_10000&sec=1516371301&di=d...

python如何下载文件式_Python 下载文件的 11 种方式

weixin_29612623的博客

01-29

426

原标题：Python 下载文件的 11 种方式译者：天天向上英文原文：https://dzone.com/articles/simple-examples-of-downloading-files-using-python在本教程中，你将学习如何使用不同的Python模块从web下载文件。此外，你将下载常规文件、web页面、Amazon S3和其他资源。最后，你将学习如何克服可能遇到的各种挑战...

python单击url下载网页文件_Python根据URL地址下载文件并保存至对应目录的实现

weixin_39635657的博客

11-20

844

引言在编程中经常会遇到图片等数据集将图片等数据以URL形式存储在txt文档中，为便于后续的分析，需要将其下载下来，并按照文件夹分类存储。本文以Github中Alexander Kim提供的图片分类数据集为例，下载其提供的图片样本并分类保存Python 3.6.5，Anaconda， VSCode1. 下载数据集文件建立项目文件夹，下载上述Github项目中的raw_data文件夹，并保存至项目目录...

判断URL是否有效的简单方法

Nnnn的博客

07-20

5660

URL地址常见协议主要包含http/https和ftp三种。验证URL地址有效性首要步骤是检查网址头部是否包含协议。如果必须包含显式的协议声明，则提取协议并判断是否在常见协议列表中。 URL地址协议格式一般为： [schema]://[dns]；或[schema]://[dns]/[path]，path in ([directory] , [path]/[directory])； schema in ('http', 'https', 'ftp')。 URL网址中的域名DNS至少包含一个域名分割

python根据url下载图片的方法

qq_33267306的博客

10-24

4858

python根据url下载图片的方法

Python下载图片并保存本地的两种方式