航空摄影图库图片爬虫脚本

最新推荐文章于 2020-11-04 14:39:31 发布

weixin_38185649

最新推荐文章于 2020-11-04 14:39:31 发布

阅读量248

点赞数

分类专栏： python图片爬虫文章标签：航空摄影图片爬虫

本文链接：https://blog.csdn.net/weixin_38185649/article/details/102601164

版权

# -*- coding:utf-8 -*-
import os
import requests
import urllib
from pyquery import PyQuery
import uuid
from pypinyin import pinyin
import unicodedata

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome"
                  "/75.0.3770.142 Safari/537.36"
}


def href_url_download():
    # 1.修改爬取的页数(1,10),默认爬取9页
    for pages in range(1, 10):
        page = str(pages)
        # http://www.aerophotos.cn/index.php?mod=search&code=search_plane&page_count=15&page=2
        url = "http://www.aerophotos.cn/index.php?mod=search&code=search_plane&page_count=15&page=" + page
        print(url)
        try:
            txt = requests.get(url, headers=headers).text
            doc = PyQuery(txt)
            # print(doc)
            air_names = doc(".nr1 td:nth-child(3)").items()
            air_nam

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_38185649

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
航空摄影图库图片爬虫脚本

# -*- coding:utf-8 -*-import osimport requestsimport urllibfrom pyquery import PyQueryimport uuidfrom pypinyin import pinyinimport unicodedataheaders = { "User-Agent": "Mozilla/5.0 (Windo...
复制链接

扫一扫