大体思路:
列表页数据条数完整,但单条数据信息不完整,所以先爬取列表页单条数据的url;
再从这个url中提取每条数据的详细信息。
import requests
import re
from bs4 import BeautifulSoup
import pandas as pd
n=0
name_list=[]
price_list=[]
r = requests.get("http://search.dangdang.com/?key=python&act=input")
html = r.text
book_url = re.findall('href="(.*?/\d{8}.html)"',html)
#在列表页爬取单条数据的url链接
for book in book_url: #遍历爬过来的url
n=n+