Python爬取妹子秀
爬虫真好玩,就是牢饭也香hhh
初体验之爬个妹子秀图库的swmt栏,上面的小妹妹…嘶溜针不戳。
不多说,上代码。第一次写,抄了这位佬的代码基本上,感谢这位佬@https://www.kancloud.cn/@noahs
用的python3.7。
会有bug,要是服务器的图片挂了就没法加载了,才疏学浅等会了再来更新代码好了(鸽了
# -*- codeing = utf-8 -*-
import requests
from bs4 import BeautifulSoup
import re
import os
import sys
import time
class download_xiuaa():
def __init__(self): #定义基础变量,文件头以及爬虫的网站
self.baseurl = "https://xiuaa.com/swmt/"
self.head = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.85 Safari/537.36 Edg/90.0.818.46"
}
self.title_list =[]
# def get_data(self):
def ask_url(self): #获取目标网站的url信息
rq = requests.get(url = self.baseurl,headers = self.head)
bs = BeautifulSoup(rq.text,"html.parser")
text = bs.find('div',id = 'cont