Python爬虫实现获取斗鱼主播信息

本文介绍了如何使用Python进行网络爬虫,以获取斗鱼直播平台的主播信息。首先,详细讲解了Python的安装及PyCharm的配置,接着通过分析网页结构,展示了如何抓取不同分类的主播列表。尽管目前的实现仅能获取在线主播,但已揭示了爬取数据的基本流程。最后,作者提供了完整的代码,欢迎读者批评指正。
摘要由CSDN通过智能技术生成

先下载安装Python以及其编写软件

https://www.python.org/downloads/ Python下载官网
选择版本 下面使用的版本为3.6.5
<img></img>
根据自己的操作系统的位数选择
这里写图片描述
打开安装文件后
这里写图片描述
把添加到环境变量打钩,可以省去后面自己配置环境变量
如果想要自己选择安装路径,点击Customize installation安装
后面默认全选就行
这里写图片描述

安装完成后,可以在命令提示符下输入 python 显示如下:
这里写图片描述

注意:32位安装后,命令提示符中Python可能遇到
这里写图片描述

下载一堆dll文件放到python.exe的根目录下就行了 下面是我打包好的地址
http://www.52wangjun.cn/dll.zip

下面我们安装一个对python比较友好的编译软件 –PyCharm
https://www.jetbrains.com/pycharm/download/#section=windows 点击右边的
这里写图片描述
软件安装完成后,还需要安装两个包requests 和 beautifulsoup4
先新建一个python工程
然后File – Settings
这里写图片描述
然后点击Project Interpreter
这里写图片描述

等加号加载出来后,点击加号 先搜索 requests 找到后点击 Install Package
这里写图片描述
这里写图片描述
后面beautifulsoup4一样
这里写图片描述
这里写图片描述
当看到Project Interpreter 显示以上内容 我们的基本安装已经完成了

二、网页分析加代码实现

下面我们进入正题 首先 我们进入斗鱼的官网
这里写图片描述
我发现首页是一些推荐的主播,并不全面,不能全部爬取,所以我这里选择了分类页
分类页地址:https://www.douyu.com/directory
这里是斗鱼所以的直播分类,我们可以看到所有的分类全部都在这一页,所以我们只需要把每个分类的地址拿到。

在浏览器中按F12,我们看到

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值