MyAnimeList爬取图片链接

本文介绍了一个Python爬虫项目,用于抓取MyAnimeList网站上的动漫图片链接。程序能有效应对网站的机器人检测,当遇到禁止访问的情况时,通过time.sleep进行等待后继续爬取。尽管存在未解决的bug,例如没有实现轮询查找当前项,而是直接填充null并跳过,但由于数据量小,暂不影响整体功能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

查询URL:
https://myanimelist.net/search/all?q=
功能:

仅爬取动漫名对应的图片链接

未解决bug:
  • 预防机器人检测,网页不定时机器人检测,禁止访问时间大概1-3分钟,不锁IP,采用time.sleep解决
  • 未采用轮询查找当前项,直接填充null,跳过,因为数据量较小,以后再改进
代码
# This is a sample Python script.

# Press Shift+F10 to execute it or replace it with your code.
# Press Double Shift to search everywhere for classes, files, tool windows, actions, and settings.
import requests
from bs4 import BeautifulSoup
import csv
import time
headers = {
   
    'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.107 Safari/537.36'

}

def getAnimeName():
    nameList = []
    with open("./name_empty.csv", 'r') as f1:
        for line in f1.readlines():
            nameList.append(line.strip
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值