下面是用到的Python 库:
import time import requests import re import os import parsel import string import re import csv
并提供了源码下载服务,后续篇章基于数据进行Python 大数据分析,生成具有巨大价值的数据图表。
一下为程序核心代码片段:
for div in divs: title =div.css('.tit a::attr(title)').get() href='http:'+div.css('.tit a::attr(href)').get() spec =div.css('.c_name::text').get()[3:] prices =div.css('.pdPrice').get() price=re.findall('\d+',prices)[0]+'.'+re.findall('\d+',prices)[1] manufacturer =div.css('.madeIn::text').get()[3:] print(title,spec,price,manufacturer,href)