爬取网易云音乐评论,破解网易云加密算法

本文介绍了如何使用Python爬取网易云音乐评论,详细解析了加密算法的破解过程,包括分析目标网页、确定参数、解析加密逻辑,帮助读者理解爬虫与网络请求的交互。
摘要由CSDN通过智能技术生成

目录

前言

一、准备工作

二、操作步骤

1.分析目标网页,确定目标链接

2.分析调用过程,确定发送请求需要的参数

 3.分析加密过程

总结



前言

        网络爬虫是一类通过程序的方式获取互联网上的信息的一种十分快捷的方式,你可以用它爬取图片、新闻以及任何你想要获取的互联网上的内容。

        网易云歌曲下的评论十分具有艺术特色,我们这次实例的目标就是将歌曲下的精彩评论爬取下来,请看接下来我是如何实现的。


一、准备工作

  1. python 3.7,pycharm
  2. 要爬取的网页:
  3. 需要的python第三方库:
    import requests
    from Crypto.Cipher import AES
    from base64 import b64encode
    import json

    (每个库的作用会在使用时进行详细说明)





二、操作步骤


1.分析目标网页,确定目标链接

  •  首先,我们需要确认目标内容是否在页面源代码里。如果存在,则可以使用BeautifulSoup或Xpath对页面源代码进行目标内容的提取;如果不存在,我们就需要找到显示目标内容的url链接,然后对其进行分析和爬取。

 

  •  很明显,在目标url的源代码中没有找到我们想要的评论,意味着现在是上述的第二种情况,我们需要找到真正可以显示出评论的url。
  •  通过浏览器上的抓包工具,我们可以看到在打开这个网页时,浏览器自动地向这些url发送了请求,并得到了相应,上图中所指的url则是包含了评论的真正的目标链接。并且在Headers中可以看到,需要传入的参数data是被加密过后的模式,由params和encSecKey构成,所以我们需要得到这两个参数。







2.分析调用过程,确定发送请求需要的参数

  • 在Intiator栏内可以查看浏览器所调用的请求堆栈,通过这个,我们可以知道浏览器进行了那些js脚本的执行过程。我们可以通过分析这些请求,来找寻我们需要的参数。

  • 从最近一次发起的请求开始,可以看到定位到了图中的高亮语句,表明最近一次请求是程序执行了此条语句,所以我们可以在此处设置一个断点,看看当程序执行到这里时会得到什么内容
  • 11
    点赞
  • 46
    收藏
    觉得还不错? 一键收藏
  • 10
    评论
评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值