- 博客(6)
- 资源 (1)
- 收藏
- 关注
原创 python学习(五)爬取今日头条图库
今天抽出时间写了一个小爬虫 来爬取今日头条的图片 简要的说下 1图片首页是通过ajax 发生请求 得到json数据 然后渲染到网页, 2然后每个详情页中 在获取的网页的源代码中 是包含图片地址的 但是直接获取img元素来获取 这就需要正则来提取 然后可以生成json 数据 来获取图片地址 主要就是这两点 明白这两点 基本就完事了 # coding=utf-8 import time impo...
2019-06-26 14:47:25 749
原创 python学习(三)time和datetime MD5
# coding=utf-8 import time if __name__ == '__main__': #time time.clock()# 返回自进程开始或之后的CPU时间 time.ctime()# 依据参数secs秒数,返回自1970开始后计算的日期,参数为空时返回当前日期时间 print("time.ctime "+time.ctime(time.time()...
2019-06-25 16:54:25 496
原创 python学习总结(二)csv newline uuid
1 csv 文件读取和写入 class Test(object): # 读取 两种方法 def read(self): with(open("ccc.csv", "r")) as f: reader = csv.reader(f) next(reader) # 是为了从数据开始读 第一行是key 值 ...
2019-06-18 20:21:07 3032
原创 python学习(四)使用scrpay框架行进爬取图片
敲黑板 将上篇 改写成了使用scrapy框架来爬取图片 这次的 使用搜索功能 你可以设置搜索的内容 将搜索结果 中的图片保存下来 pic.py 的脚本 主要的脚本 # -*- coding: utf-8 -*- import scrapy import json import random import os from urllib import parse from BeautyPic....
2019-06-18 18:07:46 346
原创 python学习(三)爬取图片
使用request 库 利用多线程抓取高清图片 网站的整个流程 首先通过AJxs 发送请求获取json 数据 然后渲染到网页上 然后可以获取每个图片主题的网址 加载每个主题的网址 可以获取图片 然后下载。 # coding=utf-8 import requests from lxml import etree import os import time import json impor...
2019-06-18 17:53:31 283
原创 python学习(二)selenium
# coding=utf-8 from selenium import webdriver from lxml import etree import time class spdier(object): def __init__(self): self.driver=webdriver.Chrome(executable_path="D:\software\chr...
2019-06-14 15:43:24 107
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人