python爬虫+数据库+flask小小小项目的爬取目标如下:

影片种类页面中每个影片类型中的前五页

包含海报图,影片名称,类型,上映日期

形成自己的电影站点

自己的影片网站中,点击对应图片或片名,也可以展现影片详情

这就意味着我们也需要在对方的每个影片详情页爬取如下内容:

影片信息上只需要爬取到片长,导演演员等不需要爬取

下载内容上,只需要爬取到下载磁力链接即可

不需要爬取在线观看地址

所有爬取的内容展现在对应的影片的详情页

请先考虑好要爬取的内容都有哪些,列成表格,建立形成一个影片数据表

然后将爬取到的内容存放到数据库该表格当中

在站点运行的时候,读取数据库中存放的所有影片信息,根据影片类型放到不同类型影片的列表页面上

根据不同的片名,将影片详情分别展现在不同的影片详情页中

圆括号当中https是每个url的固定开头,.jpg是每个图片url的结尾

所以匹配出来的结果可能是:'https://www.haibao123.xyz/01/2748.jpg', '灭亡'

https   ://www.haibao123.xyz/01/2748   .jpg

中间的部分就是 .+?\ 匹配的内容,它包含了字符和特殊符号

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值