python爬虫下载文件到指定文件夹_python爬虫: 从指定路径爬取文件

最新推荐文章于 2024-07-19 21:42:08 发布

weixin_39992072

最新推荐文章于 2024-07-19 21:42:08 发布

阅读量1.2k

点赞数

文章标签： python爬虫下载文件到指定文件夹

介绍

这个是我根据网上的经典模板修改得到的爬虫代码。在日常的开发中，用于爬取文件。

使用说明

在 spider.py 文件中，以下代码段修改成具体需要的参数：# 替换为你指定的 url

url = 'https://... ...'

运行程序即可：python spider.py

实现代码

spider.py :# coding=utf-8

import os

import urllib

import logging

import sys

# logging配置

logging.basicConfig(

format='%(asctime)s %(levelname)s %(message)s',

level=logging.INFO,

stream=sys.stdout)

file_path = os.path.join(os.getcwd(),'dir_name/file_name')

if not os.path.isfile(file_path):

logging.info("File doesn't exist.")

# 替换为你指定的 url

url = 'https://... ...'

# 一旦用于存放下载文件的本地目录：'dir_name/' 不存在

file_dir = file_path[:-9]

if not os.path.exists(file_dir):

logging.info("Mkdir 'dir_name/'.")

os.mkdir(file_dir)

def down(_save_path, _url):

try:

urllib.urlretrieve(_url, _save_path)

except:

print '\nError when retrieving the URL:', _save_path

logging.info("Downloading file.")

down(file_path, url)

else:

logging.info("File exists.")

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39992072

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

百度图片爬取_爬取_爬取图片_爬虫_python爬_python_

09-29

本篇文章将详细讲解如何利用Python爬取指定关键词的百度图片，涉及的知识点包括网络爬虫的基本原理、Python的requests库、BeautifulSoup库以及可能用到的图片处理库如PIL。首先，我们需要理解网络爬虫的工作原理。...

python爬虫爬取网站文章_手把手教你用Python实现分布式爬虫(四) - scrapy爬取技术文章网站...

weixin_39538877的博客

11-21

539

搭建scrapy的开发环境，本文介绍scrapy的常用命令以及工程目录结构分析，本文中也会详细的讲解xpath和css选择器的使用。然后通过scrapy提供的spider完成所有文章的爬取。然后详细讲解item以及item loader方式完成具体字段的提取后使用scrapy提供的pipeline分别将数据保存到json文件以及mysql数据库中.首先爬取一个网站前，我们需要分析网络的url结构，...

参与评论您还未登录，请先登录后发表或查看评论

Python爬虫入门 | 6 将爬回来的数据存到本地

Python学习部落

07-19

5102

微信：Pythonxx，加我领取学习资料用Python语句存储数据写文件时，我们主要用到 with open() 语句:with open(name,mode,encod...

怎样下载python spyder

最新发布

hakesashou的博客

07-19

694

第一步，登陆网址“https://pypi.org/project/spyder/"，点击网页右侧锚点“download files”，会出现各种版本的spyder安装包。如果你不知道电脑上的python版本，在cmd命令框中，输入“python -V"，就可以知道。第四步，输入”pip install spyder-3.3.2-py3-none-any.whl“，点击"enter"键，就可安装。第五步，安装完成后，打开cmd命令行窗口，输入”spyder3“，就可以运行该编辑器了。

python 下载文件-python爬虫之下载文件的方式总结以及程序实例

q6q6q的专栏

10-28

1613

python爬虫之下载文件的方式以及下载实例目录第一种方法：urlretrieve方法下载第二种方法：request download第三种方法：视频文件、大型文件下载实战演示第一种方法：urlretrieve方法下载程序示例：import osfrom urllib.request import urlretrieveos.makedirs('./img/',exist_ok=True) #创建...

python爬虫下载文件到指定文件夹_python爬虫系列(4.6-使用写文件的方式下载图片)...

weixin_39964869的博客

11-23

380

一、下载图片的具体代码import osimport shutilimport requestsfrom lxml import etreeclass DownImage(object):"""创建一个下载图片的类"""def __init__(self):self.urls = ['http://python.jobbole.com/category/guide/page/{0}/'.forma...

python读取文件夹下所有文件并进行内容提取

w5025的博客

06-25

7515

上网课以来，各种平台百花齐放。老师在上面发布习题，进行考试，其中微信公众号的微助教不能复制粘体老师发布的习题，针对这一情况，结合所学的知识，通过python进行数据的提取。流程如下： 1.电脑登录微信进去答题页面，右键查看源码，保存记事本中。 2.对源码进行分析 3.结合xpath和正则进行数据提取 4.保存到另一个文件夹中代码如下： import re import os from lxml import etree i=0 #定义一个变量，用来记录第几题 with open("ti.txt",

python爬虫.rar_python_python爬取图片_python爬虫_爬虫

07-14

指定一个网站，从该网站上爬取全部匹配的图片到任意指定的文件夹当中，关键是正则表达式的使用

mzitu_win_爬虫python_爬虫_python爬取图片_mzitu图片_python爬虫_

10-04

标题中的“mzitu_win_爬虫python_爬虫_python爬取图片_mzitu图片_python爬虫_”表明这是一个关于使用Python爬虫抓取Mzitu网站图片的项目。Mzitu是一个知名的网络平台，主要发布各类美女图片，因此这个项目可能是为了...

Python爬虫源码文件_pachong_python爬虫_python_website_

09-30

在本压缩包中，"Python爬虫源码文件_pachong_python爬虫_python_website_" 提供了相关的Python爬虫源代码，旨在帮助用户了解和学习如何编写爬虫来抓取网站数据。首先，我们要理解Python爬虫的基本结构。一个简单的...

python作业：爬虫爬取京东评论

07-07

Python作业：爬虫爬取京东评论；Python作业：爬虫爬取京东评论；Python作业：爬虫爬取京东评论；Python作业：爬虫爬取京东评论；Python作业：爬虫爬取京东评论；Python作业：爬虫爬取京东评论；Python作业：爬虫爬取...

爬虫爬取网站图片并存取到指定目录

04-13

py文件，直接可以运行，可从控制台和Pycharm打开，有详细的注释，基础学习练手的最佳实例

python爬虫下载文件到指定文件夹_python - 图片爬虫时候遇到问题 urllib.request.urlretrieve 下载到指定文件夹不成功？...

weixin_39662721的博客

11-23

494

问题如果下载到D盘也是没有问题的，下载到我建立的目录下就有问题（主要是我想在D盘建立以URL这个问号前面的数字为名字的目录如（http://v.yupoo.com/photos/196...'）中的46975340就是不行，因为有很多链接，每个链接的这个数字不同，我想用这个数字作为文件夹的名字，存放这个链接下载下来的图片）源码如下：import urllib.requestimport reim...

python下载文件到指定目录

weixin_42598278的博客

01-22

2284

在 Python 中可以使用 urllib 模块来下载文件。可以使用 urllib.request.urlretrieve(url, filename) 方法将文件下载到指定的目录。 import urllib.request url = 'http://www.example.com/file.txt' filename = '/path/to/save/file.txt' urllib.re...

python+selenium爬虫自动化批量下载文件

seattle2009的博客

01-19

5406

使用python+selenium自动化来代替人工去操作从网站导出文本内容下载并保存为TXT文件。

python爬虫下载文件到指定文件夹_python实现txt文本批量创建文件夹方法

weixin_39929602的博客

11-23

723

python根据txt文本批量创建文件夹前言前言：想写这个代码的原因是因为实习的时候需要根据表格名创建对应的文件夹，如果只是很少个数文件夹的话，ctrl+shift+n还可以接受吧，可是一次就要创建几百个文件夹，这就有点方方了。所以我写了一些代码解决实际的问题吧。正文正文：其实这是一个简单的代码集合，然后就实现了代码目录结构│ 创建文件夹.py├─docs│ try.txt└─folder第一个文...

爬虫下载图片信息保存到本地文件夹下

weixin_30885111的博客

11-21

315

def save_img(self,url, file_name, file_path='drug_specification'): 　　# 保存图片到磁盘文件夹 file_path中，默认为当前脚本运行目录下的 book\img文件夹　　try: 　　　　if not os.path.exists(file_path): ...

python爬虫-下载图片到本地目录

python爬虫下载文件到指定文件夹_python爬虫: 从 指定路径 爬取 文件

python爬虫下载文件到指定文件夹_python爬虫: 从指定路径爬取文件