Python爬虫系列：腾讯课堂Scrapy爬虫

最新推荐文章于 2024-04-22 17:10:00 发布

VIP文章孙老师的数据分析课

最新推荐文章于 2024-04-22 17:10:00 发布

阅读量3.7k

点赞数 1

分类专栏： Python数据分析系列文章标签： Python 爬虫

转载请申请，侵权必究！

本文链接：https://blog.csdn.net/binsun1102/article/details/79724292

版权

业务需求：

需要爬取腾讯课堂IT.互联网类别下的云计算大数据子类别下的所有课程数据：

课程名称、价格、购买人数、机构名称

1、编写item.py文件

定义要爬取的数据字段：

import scrapy

class TxktcrawlerItem(scrapy.Item):
    # define the fields for your item here like:
    title=scrapy.Field()
    users=scrapy.Field()
    price=scrapy.Field()
    agency=scrapy.Field()

2、在mysql中建表

因为需要将爬取到的数据存储到mysql中，所以首先在mysql中建表：

use test;

create table txkt(
	id int unsigned auto_increment primary key,
    title char(50),
    users int(10),
    price float(10),
    agency char(50)
);

最低0.47元/天解锁文章

优惠劵

孙老师的数据分析课

关注关注

1
点赞
踩
16

收藏

觉得还不错? 一键收藏
打赏
2
评论
Python爬虫系列：腾讯课堂Scrapy爬虫

业务需求：需要爬取腾讯课堂IT.互联网类别下的云计算大数据子类别下的所有课程数据：课程名称、价格、购买人数、机构名称1、编写item.py文件定义要爬取的数据字段：import scrapyclass TxktcrawlerItem(scrapy.Item): # define the fields for your item here like: title=scrapy.F...
复制链接

扫一扫