使用Scrapy框架爬取音乐网站数据

1.确定要爬取的对象,并在数据库中建一个表

id------------------------------------------自增

CDName---------------------------------歌曲的名字

CDFile-------------------------------------歌曲的分类

singer------------------------------------歌手的名字

CDUrl-------------------------------------歌曲的url路径

CDImg------------------------------------歌曲的图片

2.利用scrapy创建项目

scrapy startproject (项目名字)

3.通过scrapy shell工具判断要爬取的网站的内容是否能显示出来

scrapy shell (网站网址)

ps:如果scrapy指令没有用,去https://blog.csdn.net/qq_37245397/article/details/81346728

学习如何下载scrapy

4.编写items.py(要爬取的内容)

 5.在spiders文件夹中新建一个python文件,用来编写主要代码

6.在anaconda中执行脚本语句

 scrapy crawl (文件里面取的名字)Music -o music.csv

ps:数据库的一些配置

数据库字段表的定义

setting.py文件:

 

 pipelines.py文件

完整代码项目目录:

 

 结果截图

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值