爬虫
夏日&暖阳
这个作者很懒,什么都没留下…
展开
-
Python下载网易云音乐(云音乐飙升榜)
最近突然想用python写一个自动下载的工具,于是就先拿网易云来练练手,并把过程中的心得写下来便于后面有想玩这个的童鞋们参考。首先我们分析网页源码,找到我们想要的获取数据位置:每一个标签对应着飙升榜中的一首歌曲,想要查看歌曲的详细信息,可以点开标签查看。点开后,我们发现,关于歌曲时长,歌曲名称,歌曲id,图片,以及作者都可以在两个标签下找到,且想要获取的歌曲名,ID,图片以及作者都是后一个标签的不同属性值,分别对应的是‘data-res-nam’,‘data-res-id’,‘data-res-p原创 2020-08-27 12:55:19 · 940 阅读 · 1 评论 -
Python中正则表达式的简单用法
我们经常在写代码的时候,想要获取指定元素,一个万能的方法就是使用正则表达式来提取。但是对于正则表达式很多人觉得很复杂,各种符合看的都头晕,再加上网上很多资料都没系统介绍,就更加搞不懂了。因此我想写这一篇关于正则表达式的文章,来将这个看起来很高大上的东西尽量给大家说清道明。首先,正则表达式不是Python独有的,很多语言都有正则表达式,它是一个处理字符串的强大工具,有它自己的语法结构,在Python中,自带的有专门的正则表达式模块,即re模块。在讲正则表达式的语法结构之前,我们先来看下关于正则表达式的一些原创 2020-08-19 23:20:11 · 918 阅读 · 0 评论 -
Python 爬虫之Xpath的简单使用
1. 简介:Xpath是XML Path Language (XML路径语言)的缩写,是一门适用于XML脚本查找信息的语言,该语言同样也适用于在HTML中查找信息。2. 常用语法:表达式简介nodename选取此节点的所有子节点/从当前节点直接选取子节点//从当前节点选取子孙节点.选取当前节点. .从当前节点选取父节点@选取属性3. Xpath的常用表达式://name[@attr=‘string’]表示选择所有名称为name,属原创 2020-08-15 00:03:10 · 770 阅读 · 0 评论