scrapy和mysql_贪心学院作业：如何使用Scrapy框架和MySQL数据库

最新推荐文章于 2022-12-09 13:32:47 发布

weixin_39541189

最新推荐文章于 2022-12-09 13:32:47 发布

阅读量61

点赞数

文章标签： scrapy和mysql

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39541189/article/details/113202026

版权

我认为这此课讲的更好！

一、Python3建议使用 PyMySQL

PyMySQL 是在 Python3.x 版本中用于连接 MySQL 服务器的一个库，Python2中则使用mysqldb。

PyMySQL 遵循 Python 数据库 API v2.0 规范，并包含了 pure-Python MySQL 客户端库。

二、MySQL基本操作

参见Python3 MySQL 数据库连接 - PyMySQL 驱动www.runoob.com

三、代码区

main.py

from scrapy.cmdline import execute

import os

import sys

a=os.path.dirname(os.path.abspath(__file__))

print(a)

sys.path.append(os.path.dirname(os.path.abspath(__file__)))

execute(["scrapy","crawl","baidu"])

# -*- coding: utf-8 -*-

import scrapy

from urllib import parse

from baidu_tieba.items import TiebaItem

class BaiduSpider(scrapy.Spider):

name = 'baidu'

allowed_domains = ['tieba.baidu.com']

# start_urls = ['https://tieba.baidu.com/f\?ie\=utf-8\&kw\=%E9%98%B2%E8%AF%88%E9%AA%97']

start_urls = ['https://tieba.baidu.com/f?ie=utf-8&kw=%E9%98%B2%E8%AF%88%E9%AA%97']

def parse(self, response):

url_list=response.xpath('//a[@class="j_th_tit "]/@href').extract()

print(url_list)

for url in url_list:

yield scrapy.Request(url=parse.urljoin

最低0.47元/天解锁文章

weixin_39541189

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
scrapy和mysql_贪心学院作业：如何使用Scrapy框架和MySQL数据库

我认为这此课讲的更好！一、Python3建议使用 PyMySQLPyMySQL 是在 Python3.x 版本中用于连接 MySQL 服务器的一个库，Python2中则使用mysqldb。PyMySQL 遵循 Python 数据库 API v2.0 规范，并包含了 pure-Python MySQL 客户端库。二、MySQL基本操作参见Python3 MySQL 数据库连接 - PyMySQL 驱...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。