python爬虫——当当网商品比价爬虫

最新推荐文章于 2024-04-17 10:03:03 发布

过气久远

最新推荐文章于 2024-04-17 10:03:03 发布

阅读量1.3k

点赞数 2

分类专栏： python爬虫与信息提取

本文链接：https://blog.csdn.net/weixin_42596724/article/details/87546104

版权

因为淘宝网需要登录，而京东的html比较奇怪，所以最后选取了当当网

技术路线

requests——re

#CrowDangDangPrize.py
import requests
import re
import urllib
def getHTMLText(url):
    try:
        r=requests.get(url,timeout=30)
        r.raise_for_status()
        r.encoding=r.apparent_encoding
        return r.text
    except:
        return ""

def parsePage(ls,html):
    try:
        pls=re.findall(r'now\_price\"\>\&yen\;[\d\.]+',html)
        nls=re.findall(r"alt\=\'.*?\'",html)
        for i in range(len(pls)):
            price=eval(pls[i].split(';')[1])
            name=eval(nls[i].split("=")[1])
            ls.append([price,name])

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

过气久远

关注关注

2
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
python爬虫——当当网商品比价爬虫

因为淘宝网需要登录，而京东的html比较奇怪，所以最后选取了当当网#CrowDangDangPrize.pyimport requestsimport reimport urllibdef getHTMLText(url): try: r=requests.get(url,timeout=30) r.raise_for_status() ...
复制链接

扫一扫