网络爬虫
文章平均质量分 78
自己的一些小小爬虫实例
爱打瞌睡的CV君
心之所向,素心以往。
展开
-
【我的创作纪念日】关于某站的音频爬虫+GUI
爬虫原创 2023-07-03 22:29:28 · 1302 阅读 · 0 评论 -
【异步爬虫】学习笔记
【异步爬虫】学习笔记原创 2022-05-01 05:00:00 · 1026 阅读 · 0 评论 -
中国新冠疫情数据可视化
文章目录一、结果及源码展示二、项目准备1、第三方库2、知识点概况3、推荐视频三、数据获取四、数据库交互五、绘制前端页面六、Web程序开发七、未来可期一、结果及源码展示自己做的这个可视化比较朴素,简单分为七个部分:全国累计趋势(包括累计确诊、累计治愈、累计死亡)全国每日确诊、治愈情况中间比较明显的四个数据(累计确诊、每日新增、累计治愈、累计死亡)中国疫情地图(颜色深度表示每日新增情况)省份或直辖市每日新增数量前五江苏省各城市现有的确诊人数源码如下:https://github.com/原创 2022-04-11 20:06:08 · 25241 阅读 · 82 评论 -
【selenium实例一】网易云歌单封面图片
本文仅用于交流学习,不得用于商业行为原创 2022-03-04 18:37:49 · 1017 阅读 · 0 评论 -
【python单线程、多线程、协程】爬虫案例比较
【python单线程、多线程、协程】爬虫案例比较原创 2022-02-25 11:51:23 · 912 阅读 · 0 评论 -
【python爬虫】PyQuery实战:爬取某站每日榜单图片
【python爬虫】PyQuery实战:爬取P站镜像每日榜单原创 2022-01-23 22:23:03 · 698 阅读 · 0 评论 -
python爬取中国天气网中城市及其对应编号
爬取中国天气网城市及其编号原创 2022-01-07 08:46:28 · 2333 阅读 · 0 评论 -
python爬虫,将天气预报可视化
利用python爬虫,爬取天气预报的数据,并进行可视化原创 2022-01-04 14:02:23 · 8013 阅读 · 16 评论 -
爬虫“入侵”王者六周年,拿来吧你
王者荣耀六周年来临,有很多“丰厚”的活动及奖励,但有一个非常小的活动可能大家没有注意到,全英雄的同人Q版头像,也发布在游戏中。对于这么可爱的头像,我自然不会放过啦,但在游戏中一点一点地保存,太吃力了。于是,就想到了爬虫原创 2021-10-24 10:20:49 · 10086 阅读 · 11 评论 -
Python爬取王者荣耀全皮肤台词语音
Python爬取王者荣耀全皮肤台词语音原创 2021-09-05 19:39:46 · 3717 阅读 · 17 评论 -
❤️心动挑战❤️python爬虫爬取B站封面图片
对于文章,标题是其浓缩的精华;那么对于视频,其封面就可能是最亮眼的那一帧。B站,作为最近比较火热的短视频平台,其舞蹈区各种各样的舞蹈,尤其是宅舞,深受“宅男”的喜爱。(别和我说什么黑丝、jk,我真的不喜欢 )原创 2021-08-18 18:38:23 · 3885 阅读 · 16 评论 -
Python爬取王者荣耀全英雄台词语音及对应的文本
很久之前就萌生了想爬取王者荣耀英雄台词语音,因为语音资源不是很好找,从官网获得的话,也比较麻烦。最近刚好有朋友需要语音素材,于是我就顺便帮了他一把。完成这次爬虫,前前后后大概花了8个小时左右,用了之前没用到的库,和一些函数用法,导致bug,以至于花费时间来解决。而且因为自己过于盲目地爬取,一开始没有具体分析,到后来慢慢完善,总共写了三个版本。第一个版本,写一半发现,爬取失败;第二个版本,能够顺利爬取语音及相关文本,但是不够全面;第三个版本,顺利地爬取了全部语音及相关文本,并进行合理地合成,方便欣赏。原创 2021-08-13 21:02:18 · 9112 阅读 · 43 评论 -
Python爬虫有用的库:pydub,处理音视频的库
Python爬虫有用的库:pydub,处理音视频的库原创 2021-08-13 20:29:09 · 862 阅读 · 0 评论 -
Python爬虫有用的库:tqdm,生成进度条
练习爬虫的小伙伴,在爬取数据比较多的时候,有时候等候的时间比较久一点,因为不知道具体的进度,可能会感到一丝丝无聊本篇文章的主角“tqdm”可以很好地解决这个问题,让你的工程进度显然易见。原创 2021-08-10 12:03:16 · 1293 阅读 · 3 评论 -
Python爬虫有用的库:chardet,自动检测字符编码
练习爬虫的许多小伙伴,在爬取网页时,肯定遇到过页面乱码的情况,其实是网页编码没有成功配对。虽然在HTML页面中有charset标签,可以查看,或者一种一种编码地试,大概率也能不难地实现。那如果有第三方库,帮助我们检测网页编码,岂不美哉!于是就有了这篇文章“主角”的登场:chardet原创 2021-08-10 12:02:47 · 4550 阅读 · 0 评论 -
Python爬虫有用的库:fake_useragent,自动生成请求头
利用第三方库fake-useragent,随机生成user-agent,解决请求头问题,增加爬虫的真实性。原创 2021-08-09 16:22:33 · 27004 阅读 · 11 评论 -
python爬虫有用的库:you-get
初步接触you-get,真的是一个宝藏!原创 2021-02-17 16:35:45 · 4698 阅读 · 1 评论 -
python爬取王者荣耀英雄的背景故事
使用四个函数讲述《王者荣耀》的故事。现在,我有故事,你有酒吗?原创 2021-07-24 14:09:31 · 2566 阅读 · 17 评论 -
python爬取指定分辨率模特壁纸
最近几天不知道该咋过?没有对象就new一个呗!原创 2021-05-21 19:10:46 · 1146 阅读 · 2 评论 -
python爬取海量PPT模板,再也不用辛苦地找模板了
还在担心没有PPT模板吗?那就使用python自动化下载海量PPT模板吧!原创 2021-05-06 10:31:38 · 6842 阅读 · 11 评论 -
python爬虫带你玩转日系P站
很多小伙伴都喜欢二次元风格,而二次元文化在日本发展的比较早。今天就用python爬虫带你玩转日系P站----Animex动漫社,让你斩获大批的日系风格壁纸与画作。原创 2021-03-20 10:41:50 · 5190 阅读 · 16 评论 -
python也可以成为贴心小管家--每日播报考研倒计时、天气情况、还有“营养鸡汤”
对于考研,你还在每天数着还有多少天吗?对于天气,你还每天去看天气预报吗?你每天需要看一些励志话语来督促自己前进吗?python可以合上述三者为一体帮你轻松实现你的日常!原创 2021-03-14 10:17:22 · 6365 阅读 · 30 评论 -
python实现不登陆淘宝却获取到任意商品数据
利用python,爬取任意商品的数据内容。原创 2021-03-13 10:30:39 · 2153 阅读 · 1 评论 -
python爬虫探索原神世界二(角色同人篇)
和之前爬取的角色网页相比,这个网页稍微简单一点,但依然是动态网页。原创 2021-03-09 11:12:43 · 5342 阅读 · 5 评论 -
python爬虫探索原神世界(角色篇)
《原神》是一款开放世界冒险游戏,有着丰富多彩的元素,可爱帅气的人物角色,五彩斑斓的风景,那我们怎么使用python爬虫打开“原神世界”的大门呢?我们今天就来用python爬虫探索一下游戏角色!原创 2021-03-05 21:13:39 · 9963 阅读 · 16 评论 -
python爬虫一键爬取美女图片(梅开三度)
PyQuery的爬虫实战原创 2021-02-26 13:08:06 · 1857 阅读 · 4 评论 -
Python爬虫,超简单地实现一键提取原画
利用xpath一键提取原画壁纸,并且将壁纸合成视频,以便观看。原创 2021-02-25 11:48:28 · 7702 阅读 · 32 评论 -
python一键爬取美女图片(梅开二度)
之前写过一篇正则表达式爬美女图片的文章,大佬说,xpath更准确,于是今天尝试了一下xpath。哇塞,xpath比正则好用不要太多,不仅准确,而且不需要自己去找节点,用Google Chrome可以直接copy。原创 2021-02-24 15:15:37 · 1705 阅读 · 0 评论 -
python爬虫--小说爬取
使用requests+bs4模块完成简单的爬虫实例--笔趣阁篇。并且利用列表,将所有的小说内容放在一个txt文件中。原创 2021-02-16 22:32:39 · 5739 阅读 · 22 评论 -
python爬虫轻松下载某易云音乐
运用了selenium、requests及bs4库,对某易云音乐进行了简单的爬取原创 2021-02-07 12:19:02 · 7993 阅读 · 17 评论 -
requests库+正则表达式--简单爬虫实例--美女图片篇
用requests库+正则表达式完成简单爬虫实例–美女图片篇原创 2021-01-22 14:14:03 · 1621 阅读 · 14 评论 -
正则表达式——常用的匹配规则
常用的匹配规则匹配字符符号匹配规则.匹配任意1个字符,除了换行符\n[ ]这是一个集合,匹配[ ]中的任意一个字符\d匹配一个数字,即0-9\D匹配非数字,即不是数字\s匹配空白,即空格,tab键\S匹配非空白\w匹配单词字符,即a-z,A-Z,0-9\W匹配非单词字符*匹配前一个字符出现0次或无数次,即可有可无+匹配前一个字符出现1次或无数次,即至少出现1次\ ?匹配前一个字符出现1次或0次,即要么有原创 2021-01-12 18:01:55 · 1338 阅读 · 1 评论 -
网络爬虫-----Requests库入门
网络爬虫-----Requests库入门1、requests.get()使用requests.get(url)url:拟获取页面的url链接response对象的属性如下:r.encoding:如果header种不存在charset,则认为编码为ISO-8859-1r.apparent_encoding:根据网页内容分析出的编码方式大概流程如下:首先使用 r.status_code返回200,则使用 r.text r.encoding r.apparent_encodi原创 2020-10-11 14:44:50 · 801 阅读 · 1 评论