关闭

python爬虫: 指定 关键字 来 爬取图片

介绍这个是我根据网上的经典模板修改得到的爬虫代码,在日常的图像识别开发中,用于爬取数据集。使用说明在 spider.py文件中,以下代码段修改成具体需要的参数:add_arg('--keyword', '-kw', default='pretty girl', help='输入关键字') add_arg('--download_page', '-dp', default=1, type=int, h...
阅读(35) 评论(0)

python爬虫: 从 指定路径 爬取 文件

实现代码# coding=utf-8 import os import urllib import logging import sys# logging配置 logging.basicConfig( format='%(asctime)s %(levelname)s %(message)s', level=logging.INFO, stream=sys.stdout)fi...
阅读(34) 评论(0)

python: @ 符号 作用

概述在python写的源码中,经常会看到 @ 这个符号。上 StackOverflow 查了一下它的作用,在 What does the “at” (@) symbol do in Python? 中找到答案。总而言之,在python中 @ 符号 起到 Decorators (注释) 的作用。用法提前注明接下来是 属性 介绍:@property 提前注明接下来是 类方法 介绍:@classmetho...
阅读(26) 评论(0)

python: enumerate

API enumerate(sequence, [start=0])Argssequence – 一个序列、迭代器或其他支持迭代对象。 start – 下标起始位置 Returns返回 enumerate(枚举) 对象。 示例  将 enumerate(枚举)对象 存在一个list中返回:seq = ['Spring', 'Summer', 'Fall', 'Winter'] print lis...
阅读(53) 评论(0)

python: 上下文管理器(context manager)

定义允许你在有需要的时候,精确地分配和释放资源用途上下文管理器的一个常见用例,是资源的加锁和解锁,以及关闭已打开的文件优点避免了琐碎操作:通过使用with,许多样板代码可以被消掉 避免了遗忘步骤:因此不用关注嵌套代码如何退出,又能确保我们的文件会被关闭,避免了代表其中最常见的就是with语句了 python提供了with语句语法,来构建对资源的自动创建与自动释放示例小白代码:file = ope...
阅读(42) 评论(0)

python: range、xrange 探究

概述  xrange 和 range 这两个基本上都是在循环的时候用。  xrange 用法与 range 完全相同,所不同的是生成的不是一个list对象,而是一个生成器。  生成很大的数字序列的时候,用 xrange 会比 range 性能优很多,因为不需要一上来就开辟一块很大的内存空间。所以尽量用 xrange 。实验 range ( [start,] stop [, step] ) >>...
阅读(64) 评论(0)

python: 递归记录 指定后缀名 的文件

# coding=utf-8import ossave_txt = './paths.txt' # 记录路径的文档 root_folder = './root' # 将被递归的文件夹根目录 suffix_name = '.jpg' # 后缀名# 递归记录指定后缀名的文件的绝对路径 def write_file_path_to_txt(folder, save_txt): out_file =...
阅读(81) 评论(0)

python: input()、raw_input() 探究

实验a = input('请输入:') print a 如果输入字符串,则马上报错:请输入:str Traceback (most recent call last): File "", line 1, in File "", line 1, in 但是如果输入整数,却不会报错:请输入:10 10如果把 input 改成...
阅读(64) 评论(0)

python: time模块、datetime模块

时间上下限import datetimeprint 'min : ', datetime.datetime.min print 'max : ', datetime.datetime.maxmin : 0001-01-01 00:00:00 max : 9999-12-31 23:59:59.999999datetime.datetime.now(...
阅读(67) 评论(0)

python: 前后缀操作

返回后缀名import ospath = 'first_directory/second_directory/file.txt' print os.path.splitext(path)[1] print type(os.path.splitext(path)[1]).txt 前缀名的bool判断path = 'first_directory/second_directory...
阅读(62) 评论(0)
38条 共4页1 2 3 4 下一页 尾页
    个人资料
    • 访问:38071次
    • 积分:2569
    • 等级:
    • 排名:第14946名
    • 原创:219篇
    • 转载:3篇
    • 译文:0篇
    • 评论:2条
    博客专栏
    文章分类