scrapy和mysql_贪心学院作业:如何使用Scrapy框架和MySQL数据库

我认为这此课讲的更好!

一、Python3建议使用 PyMySQL

PyMySQL 是在 Python3.x 版本中用于连接 MySQL 服务器的一个库,Python2中则使用mysqldb。

PyMySQL 遵循 Python 数据库 API v2.0 规范,并包含了 pure-Python MySQL 客户端库。

二、MySQL基本操作

参见Python3 MySQL 数据库连接 - PyMySQL 驱动​www.runoob.com

三、代码区

main.py

from scrapy.cmdline import execute

import os

import sys

a=os.path.dirname(os.path.abspath(__file__))

print(a)

sys.path.append(os.path.dirname(os.path.abspath(__file__)))

execute(["scrapy","crawl","baidu"])

# -*- coding: utf-8 -*-

import scrapy

from urllib import parse

from baidu_tieba.items import TiebaItem

class BaiduSpider(scrapy.Spider):

name = 'baidu'

allowed_domains = ['tieba.baidu.com']

# start_urls = ['https://tieba.baidu.com/f\?ie\=utf-8\&kw\=%E9%98%B2%E8%AF%88%E9%AA%97']

start_urls = ['https://tieba.baidu.com/f?ie=utf-8&kw=%E9%98%B2%E8%AF%88%E9%AA%97']

def parse(self, response):

url_list=response.xpath('//a[@class="j_th_tit "]/@href').extract()

print(url_list)

for url in url_list:

yield scrapy.Request(url=parse.urljoin

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值