爬虫部分的代码是xpath实现的,不妥的地方还请大佬们指点
运行结果如下:
这里做了一个判断,中文的话转成拼音,拼接进url中进行解析
输入有误的话会执行循环,判断输入的内容类型是不是在列表里面
源码如下:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time : 2020/11/9 18:32
# @Author : huni
# @File : 爬彼岸图网.py
# @Software: PyCharm
import requests
from lxml import etree
import os
from pypinyin import lazy_pinyin
def main():
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.183 Safari/537.36'
}
while True:
typelist = ['fengjing','meinv','youxi','dongman','yingshi','mingxing','qiche','dongwu','renwu','meishi','zongjiao','beijing']
print('4K风景,4K美女,4K游戏,4K动漫,4K影视,4K明星,4K汽车,4K动物,4K人物,4K美食,4K宗教,4K背景'