【python疑问（已解决）】爬虫时出现IndexError: list index out of range的错误

最新推荐文章于 2024-05-30 10:07:56 发布

GraceWangWYY

最新推荐文章于 2024-05-30 10:07:56 发布

阅读量7k

点赞数 4

分类专栏： python问题文章标签： python 正则表达式

本文链接：https://blog.csdn.net/GraceWangWYY/article/details/115034934

版权

# -*- coding: utf-8 -*-
"""
Created on Thu Mar 18 17:30:27 2021

@author: wangyu
"""
from bs4 import BeautifulSoup
import re
import urllib.request,urllib.error
import xlwt
import sqlite3#进行SQLite数据库操作

def main():
    baseurl='https://movie.douban.com/top250?start='
    #1、爬取网页
    datalist=getData(baseurl)
    #savepath='.\\豆瓣电影top250.xls'#.表示当前位置，
    #3、保存数据
    #saveData=(savepath)
    
   # askURL('https://movie.douban.com/top250')

findLink = re.compile(r' <a href="(.*?)">')#创建正则表达式对象，表示规则
#findLink = re.compile(r'<a href="(.*?)">')  

#爬取网页
def getData(baseurl):
    datalist=[]
    for i in range(0,10):#调用获取页面的信息10次
        url=baseurl+str(i*25)
        html=askURL(url)  #保存获取到的网页源码
        



    #2、逐一解析数据
        soup=BeautifulSoup(html,'html.parser')
        for item in soup.find_all('div&

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

GraceWangWYY

关注关注

4
点赞
踩
8

收藏

觉得还不错? 一键收藏
5
评论
【python疑问（已解决）】爬虫时出现IndexError: list index out of range的错误

# -*- coding: utf-8 -*-"""Created on Thu Mar 18 17:30:27 2021@author: wangyu"""from bs4 import BeautifulSoupimport reimport urllib.request,urllib.errorimport xlwtimport sqlite3#进行SQLite数据库操作def main(): baseurl='https://movie.douban.com/top2
复制链接

扫一扫