基于Python语言豆瓣电影数据挖掘与分析

在这里插入这是爬取图片描述

本文使用的语言是Python,至于为什么选Python,当然是他简单啦!好吧,其实我是被逼的,我们老师逼我们用python写爬虫。

   这里的采集豆瓣电影的网址是(**https://movie.douban.com/tag/#**),如上图


  大家知道爬虫的三步骤嘛,开门——抓住她——抗回家,哈哈,是不是很直接很暴力哈。
  
  第一:找到网址,然后打开她。

  第二:找到自己想采集数据的位置(这里的位置指的是在哪个div下的p标签下啊)
  <div>
               <p>hello,girl</p>
  < /div >

这里的hello girl就在这里面。

  第三:就是将采集的数据保存在文本里呀,或者.csv 或者.json里。当然常见的是保存在数据库里。

以上就是爬虫的经典三步骤。

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值