Python爬虫爬取太平洋汽车网的汽车信息，将信息存进MongoDB数据库

最新推荐文章于 2021-12-01 08:59:00 发布

New_boy25

最新推荐文章于 2021-12-01 08:59:00 发布

阅读量1.8k

点赞数

分类专栏： Python 文章标签：爬虫 requests mongodb pymongo queue

本文链接：https://blog.csdn.net/New_boy25/article/details/101795114

版权

本次代码用于练习爬虫的基本步骤，并且添加了与mongoDB数据库的交互

导入的模块：requests、threading、lxml、queue、pymongo

代码思路：

生成url列表
请求url，获取响应。
用xpath解析响应中的li元素（指定ul下的）
遍历包含li元素的列表，再次用xpath解析得到所有文本，将所需的文本放进字典中。
把所有字典放进一个列表，实例化MongoClient对象，在"test_db"数据库下创建"auto_info"集合，将包含汽车信息的列表添加到集合。

# conding=utf-8

import requests
import threading
from lxml import etree
from queue import Queue
from pymongo import MongoClient


class AutoSpider(object):
    def __init__(self):
        self.headers = {
            "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

New_boy25

关注关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
Python爬虫爬取太平洋汽车网的汽车信息，将信息存进MongoDB数据库

本次代码用于练习爬虫的基本步骤，并且添加了与mongoDB数据库的交互导入的模块：requests、threading、lxml、queue、pymongo代码思路：生成url列表请求url，获取响应。用xpath解析响应中的li元素（指定ul下的）遍历包含li元素的列表，再次用xpath解析得到所有文本，将所需的文本放进字典中。把所有字典放进一个列表，实例化MongoClient...
复制链接

扫一扫