自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

梦想橡皮擦,专栏100例写作模式先行者,现象级专栏 《Python 爬虫 100 例》作者、《滚雪球学 Python 专栏》原创者

Python 领域创作者,华为OD机考题库整理者,C 系语言爱好者,爬虫100例作者,120作者,滚雪球学Python作者

  • 博客(13)
  • 资源 (454)
  • 问答 (2)
  • 收藏
  • 关注

原创 Python爬虫入门教程 49-100 Appium安装+操作51JOB_APP(模拟手机操作之一)手机APP爬虫

在开始安装Appium之前,你要先知道Appium是做什么的?Appium 是一个自动化测试开源工具,看到没,做测试用的,它有点类似Selenium,可以自动操作APP实现一系列的操作。标记重点,可以使用python对Appium编写脚本,实现对App的抓取。今天就给你写一个100%叫你可以运行起来的入门实例。

2019-01-28 16:33:05 20132 9

原创 Python爬虫入门教程 48-100 使用mitmdump抓取手机惠农APP-手机APP爬虫部分

1. 爬取前的分析mitmdump是mitmproxy的命令行接口,比Fiddler、Charles等工具方便的地方是它可以对接Python脚本。有了它我们可以不用手动截获和分析HTTP请求和响应,只需写好请求和响应的处理逻辑即可。它还可以实现数据的解析、存储等工作,这些过程都可以通过Python实现。1.1 启动mitmdump 保存到文件使用命令mitmdump -w crawl....

2019-01-23 15:24:33 19506 3

原创 Python爬虫入门教程 47-100 mitmproxy安装与安卓模拟器的配合使用-手机APP爬虫部分

1. 准备下载软件介绍一款爬虫辅助工具mitmproxy ,mitmproxy 就是用于MITM的proxy,MITM中间人攻击。说白了就是服务器和客户机中间通讯多增加了一层。跟Fiddler和Charles最大的不同就是,mitmproxy可以进行二次开发,尤其可以对接python。mitmproxy一般用于开发或者测试,用在爬虫辅助也是极好的。1.1 几个重要地址github地址:ht...

2019-01-22 23:57:36 19641 1

原创 Python爬虫入门教程 46-100 Charles抓取手机收音机-手机APP爬虫部分

1. 手机收音机-爬前叨叨今天选了一下,咱盘哪个APP呢,原计划是弄荔枝APP,结果发现竟然没有抓到数据,很遗憾,只能找个没那么圆润的了。搜了一下,找到一个手机收音机 下载量也是不错的。2. 爬虫套路爬虫基本套路抓包获取链接分析数据抓数据使用 Charles 分析APP 得到提取链接如下 https://rapi.qingting.fm/categories/4...

2019-01-16 22:36:26 19159 8

原创 Python爬虫入门教程 45-100 Charles抓取兔儿故事-下载小猪佩奇故事-手机APP爬虫部分

1. Charles抓取兔儿故事背景介绍之前已经安装了Charles,接下来我将用两篇博客简单写一下关于Charles的使用,今天抓取一下兔儿故事里面关于小猪佩奇的故事。爬虫编写起来核心的重点是分析到链接,只要把链接分析到,剩下的就好办了。2. 待爬取APP链接分析夜神模拟器安装APP完毕,之后打开相应的软件,进去到小猪佩奇的分类清单,注意Charles,在里面尽量的去找到下图的链接,说...

2019-01-14 22:57:34 20077 1

原创 Python爬虫入门教程 44-100 Charles的安装与使用-手机APP爬虫部分

1. 第二款抓包工具Charles安装与使用Charles和Fiddler一样,也是一款抓包工具,比Fiddler界面更加清晰,支持多平台1.1 官方网址https://www.charlesproxy.com/1.2 下载地址Charles工具下载地址:https://www.charlesproxy.com/download/自己去百度一款,我找了2个百度网盘的 链接挂了就...

2019-01-11 11:17:05 20128 4

原创 Python爬虫入门教程 43-100 百思不得姐APP数据-手机APP爬虫部分

1. Python爬虫入门教程 爬取背景2019年1月10日深夜,打开了百思不得姐APP,想了一下是否可以爬呢?不自觉的安装到了夜神模拟器里面。这个APP还是比较有名和有意思的。下面是百思不得姐的简介年度超好玩的搞笑内容平台,整个互联网能嗨翻宇宙的神级脑洞大神段子手们都在这..新鲜的视频,爆笑的段子,有趣的GIF囧图,承包所有你无聊的时间。更有“姐夫”们毁天灭地“神评论”,花式吐槽,脑洞...

2019-01-10 23:12:04 19574 1

原创 Python爬虫入门教程 42-100 爬取儿歌多多APP数据-手机APP爬虫部分

1. 儿歌多多APP简单分析今天是手机APP数据爬取的第一篇案例博客,我找到了一个儿歌多多APP,没有加固,没有加壳,没有加密参数,对新手来说,比较友好,咱就拿它练练手,熟悉一下Fiddler和夜神模拟器是如何配合着使用的。儿歌多多APP在豌豆荚的下载量还是可以的,一家做内容的APP。2. APP安装和使用APP直接去下载APK包就可以了,拖拽到夜神模拟器就安装成功了。在模拟器打开出现如...

2019-01-09 23:37:08 19248 3

原创 Python爬虫入门教程 41-100 Fiddler+夜神模拟器+雷电模拟器配置手机APP爬虫部分

从40篇博客开始,我将逐步讲解一下手机APP的爬虫,关于这部分,我们尽量简化博客内容,在这部分中可能涉及到一些逆向,破解的内容,这部分尽量跳过,毕竟它涉及的东西有点复杂,并且偏离了爬虫体系太远,有兴趣的博友,可以一起研究下。之前看到知乎有人对手机App爬虫归类,基本符合规则,接下来的10篇博客可能集中在80%的App上,所以还是比较简单的50%的app,通过抓包软件就可以分析出抓取...

2019-01-08 14:50:13 20752 5

原创 Python爬虫入门教程 40-100 博客园Python相关40W博客抓取 scrapy

爬前叨叨第40篇博客吹响号角,爬取博客园博客~本文最终抓取到了从2010年1月1日到2019年1月7日的37W+文章,后面可以分析好多东西了呢经常看博客的同志知道,博客园每个栏目下面有200页,多了的数据他就不显示了,最多显示4000篇博客如何尽可能多的得到博客数据,是这篇文章研究的一点点核心内容,能√get到多少就看你的了~单纯的从每个栏目去爬取是不显示的,转换一下思路,看到搜索页面,有...

2019-01-07 19:39:16 19697 3

原创 Python爬虫入门教程 39-100 天津市科技计划项目成果库数据抓取 scrapy

爬前叨叨缘由今天本来没有打算抓取这个网站的,无意中看到某个微信群有人问了一嘴这个网站,想看一下有什么特别复杂的地方,一顿操作下来,发现这个网站除了卡慢,经常自己宕机以外,好像还真没有什么特殊的…爬取网址 http://cgk.kxjs.tj.gov.cn/navigation.do有很明显的分页表示列表如下Request URL: http://cgk.kxjs.tj.gov.cn...

2019-01-07 15:07:11 19382

原创 Python爬虫入门教程 38-100 教育部高校名单数据爬虫 scrapy

爬前叨叨今天要爬取一下正规大学名单,这些名单是教育部公布具有招生资格的高校名单,除了这些学校以外,其他招生的单位,其所招学生的学籍、发放的毕业证书国家均不予承认,也就是俗称的野鸡大学!网址是 https://daxue.eol.cn/mingdan.shtml 爬取完毕之后,我们进行一些基本的数据分析,套路如此类似,哈哈这个小项目采用的是scrapy,关键代码import scrapy...

2019-01-03 22:53:09 20051 3

原创 Python爬虫入门教程 37-100 云沃客项目外包网数据爬虫 scrapy

爬前叨叨2019年开始了,今年计划写一整年的博客呢~,第一篇博客写一下 一个外包网站的爬虫,万一你从这个外包网站弄点外快呢,呵呵哒数据分析官方网址为 https://www.clouderwork.com/进入全部项目列表页面,很容易分辨出来项目的分页方式get异步请求Request URL:https://www.clouderwork.com/api/v2/jobs/sear...

2019-01-02 10:45:03 20206 5

Linux date命令.pptx

linux dateLinux date命令.pptxLinux date命令.pptxLinux date命令.pptx

2024-01-31

数据库课程设计.pptx

数据库课程设计通常是计算机科学或信息技术相关专业的一部分,旨在帮助学生掌握数据库设计、开发和管理的基本原则和技能。以下是一个典型的数据库课程设计大纲,供您参考: ### 课程名称:数据库课程设计 #### 课程目标: - 理解数据库管理系统的基本概念和原理。 - 学会使用数据库设计工具,设计和规划数据库系统。 - 掌握SQL语言,能够进行数据库的查询、更新、删除等操作。 - 学会数据库性能优化和安全管理。 - 能够进行实际的数据库应用开发和设计。 #### 课程大纲: **第一部分:数据库基础** 1. 数据库管理系统(DBMS)概述 2. 数据库设计范式 3. 实体关系模型(ER模型)和关系模型 4. SQL语言基础 **第二部分:数据库设计和规划** 1. 数据库设计工具的使用 2. 数据库设计的规范和范式 3. 数据库安全性设计 4. 数据库性能优化策略 **第三部分:数据库应用开发** 1. 数据库连接和操作(使用编程语言如Python、Java等) 2. Web应用中的数据库集成 3. 移动应用中的数据库集成 4. 大数据和云数据库的基本概念

2024-01-12

Python圣诞节.pptx

Python圣诞节.pptx Python圣诞节.pptx Python圣诞节.pptx Python圣诞节.pptx

2023-12-26

圣诞树代码编程Python.pptx

圣诞树代码编程python

2023-12-19

华为OD机试.pptx

贰壹贰叁零华为OD机试.pptx 华为OD机试.pptx 华为OD机试.pptx

2023-12-15

Docker教程.pptx

Docker教程.pptx Docker教程.pptx Docker教程.pptx Docker教程.pptx

2023-12-04

OpenCV教程或项目资源.pptx

OpenCV教程或项目资源.pptxOpenCV教程或项目资源.pptxOpenCV教程或项目资源.pptxOpenCV教程或项目资源.pptx

2023-11-27

Linux常用命令.pptx

Linux常用命令 Linux常用命令.pptx Linux常用命令.pptx Linux常用命令.pptx Linux常用命令.pptx Linux常用命令.pptx

2023-11-21

Python爬虫资源.pptx

Python爬虫资源.pptx Python爬虫资源.pptx Python爬虫资源.pptx Python爬虫资源.pptx

2023-11-21

蓝桥杯算法题PPT.pptx

蓝桥杯算法题PPT.pptx 蓝桥杯算法题PPT.pptx 蓝桥杯算法题PPT.pptx

2023-11-19

程序员简历模板.pptx

程序员简历模板.pptx

2023-11-09

Python 编程练习题,每页一个.pptx

上传Python编程练习题、竞赛题、面试题和实战项目题。完成上传与审核后,将获得6分的奖励分。 1、要点:每个题目都应包含完整的输入说明、输出说明,并提供多组用例。 2、文件:至少包含一个题目文档,其中包含题目描述、解题思路;以及一个可运行的Python代码文件。 3、文案:标题不少于20字,简介不少于50字。推荐免费使用C知道AI生成:https://so.csdn.net/chat

2023-11-09

华为OD面试开放数据PPT大纲.pptx

OD面试,即Outsourcing Development面试,是一种通过外包公司进行的面试方式。 OD面试通常用于技术岗位,如软件开发、测试等。 OD面试的流程与普通面试类似,包括笔试、面试等环节。 OD面试的优势在于可以节省企业的招聘成本,提高招聘效率。

2023-11-07

Vue面试题.pptx Vue面试题.pptx Vue面试题.pptx

Vue面试题.pptx Vue面试题.pptx

2023-10-31

如何学习MATLAB.pptx

如何学习MATLAB.pptx 如何学习MATLAB.pptx 如何学习MATLAB.pptx如何学习MATLAB.pptx如何学习MATLAB.pptx

2023-10-25

matlab 矩阵数组第一讲.pptx

mysql安装配置教程 mysql安装配置教程 mysql安装配置教程 mysql安装配置教程 mysql安装配置教程

2023-10-23

用Python实现爱心代码.pptx

爱心代码用Python实现爱心代码.pptx用Python实现爱心代码.pptx用Python实现爱心代码.pptx用Python实现爱心代码.pptx用Python实现爱心代码.pptx

2023-10-19

爱心代码.pptx爱心代码.pptx

爱心代码

2023-10-19

YOLO学习.pptx

YOLO学习.pptx 2023年10月学习资料

2023-10-15

华为OD-技术综合面,手撕代码真题整理(99):最小生成树在城市规划中的应用-最长公共子序列问题.md

华为OD_技术综合面,手撕代码真题整理(99):最小生成树在城市规划中的应用___最长公共子序列问题.md

2023-10-15

YOLO初级学习大纲.pptx

YOLO初级学习大纲.pptx YOLO初级学习大纲.pptx YOLO初级学习大纲.pptx YOLO初级学习大纲.pptx

2023-10-08

Matlab资源.pptx

** 提供Matlab软件下载、安装、更新等服务

2023-09-28

AmazonCodeWhisperer.pptx Amazon CodeWhisperer是一个用于代码审查和优化的工具

Amazon CodeWhisperer是一个用于代码审查和优化的工具

2023-09-28

rk3399android71平台新增HDMI特殊分辨率输出改补丁.pptx

原因:rk3399的android7.1平台在HDMI输出时存在分辨率问题,导致显示效果不佳 必要性:为了提升用户体验,需要修改HDMI特殊分辨率输出,以实现更好的显示效果 背景:rk3399的android7.1平台在HDMI输出时存在分辨率问题,导致显示效果不佳 解决方案:通过修改HDMI特殊分辨率输出,实现更好的显示效果

2023-09-20

matplotlib.pptx

matplotlib 是一个用于创建静态、动态和交互式图形的 Python 库。 它提供了一整套类似于 MATLAB 的绘图函数,可以生成高质量的图形。 matplotlib 支持多种图形格式,如 PNG、JPG、EPS、PDF 等。 它广泛应用于数据可视化、科学计算和机器学习等领域。

2023-09-20

使用Rational Rose创建模型:详细教程与示例代码.md

使用Rational Rose创建模型:详细教程与示例代码.md 使用Rational Rose创建模型:详细教程与示例代码.md 使用Rational Rose创建模型:详细教程与示例代码.md 使用Rational Rose创建模型:详细教程与示例代码.md

2023-09-14

KMP算法C++实现.pptx

KMP 算法的核心思想是避免在文本串中进行不必要的比较。在传统的朴素匹配算法中,每当我们在文本中找到不匹配的字符时,我们会将子串向右移动一个位置,并重新开始比较。这种方法的问题是,我们可能会多次比较相同的字符。 KMP 算法通过构建部分匹配表(也称为失配函数)来解决这个问题,以在不匹配时跳过尽可能多的字符。部分匹配表告诉我们在不匹配时应该将子串移动到的位置,而不是每次都向右移动一个位置。这样,我们可以避免不必要的比较,提高了算法的效率。

2023-09-13

KMP 算法,即 Knuth-Morris-Pratt 算法,是一种用于字符串匹配的经典算法 与朴素的字符串匹配算法相比,KMP

KMP 算法,即 Knuth-Morris-Pratt 算法,是一种用于字符串匹配的经典算法。与朴素的字符串匹配算法相比,KMP 算法具有更高的效率,特别是在处理大型文本时。本文将介绍 KMP 算法的原理,并提供 C++示例代码来演示如何实现它。

2023-09-13

大学生 Python爬虫入门指南.pptx

大学生 Python爬虫入门指南.pptx 大学生 Python爬虫入门指南.pptx 大学生 Python爬虫入门指南.ppt 大学生 Python爬虫入门指南.pptx 大学生 Python爬虫入门指南.pptx 大学生 Python爬虫入门指南.ppt 大学生 Python爬虫入门指南.pptx 大学生 Python爬虫入门指南.pptx 大学生 Python爬虫入门指南.ppt

2023-09-08

Python爬虫的网页内容提取与数据分析:提升SEO效果实战指南.pptx

Python爬虫的网页内容提取与数据分析:提升SEO效果实战指南.pptx Python爬虫的网页内容提取与数据分析:提升SEO效果实战指南.pptx Python爬虫的网页内容提取与数据分析:提升SEO效果实战指南.pptx Python爬虫的网页内容提取与数据分析:提升SEO效果实战指南.pptx Python爬虫的网页内容提取与数据分析:提升SEO效果实战指南.pptx

2023-09-08

MATLAB是一种编程语言和数学计算环境

主要应用于科学计算、数据分析和工程设计等领域 提供丰富的工具箱和函数库,支持各种数学运算和图形绘制 集成开发环境(IDE),包括代码编辑器、调试器和图形用户界面(GUI) 支持多种操作系统,如Windows、Linux和macOS

2023-08-29

MATLAB三维数组详解与应用

三维数组的定义与创建 三维数组的属性与操作 三维数组的可视化与应用 三维数组的定义与创建 三维数组的属性与操作 三维数组的可视化与应用 三维数组的定义与创建 三维数组的属性与操作 三维数组的可视化与应用

2023-08-23

python itertools.pptx

在Python中,迭代是一种常见的数据处理方式。然而,对于大规模数据集,迭代性能的优劣直接影响到程序的运行效率。本文将介绍如何利用Itertools模块来优化Python迭代性能,并通过案例分析深入解析Itertools的工作原理。最后,我们将对Itertools优化Python迭代性能的知识点进行详细解答,以帮助读者更好地理解和应用Itertools。

2023-08-21

Pythonlower函数用法PPT.pptx

- 字符串对象:在 Python 中,字符串是不可变的对象。这意味着一旦创建了一个字符串,就不能修改其内容。因此,`lower()`函数返回的是一个新的字符串,而不是修改原始字符串。 - ASCII 码表:在计算机中,每个字符都有一个对应的 ASCII 码。字母字符的 ASCII 码值是不同的,其中大写字母的 ASCII 码值比小写字母的 ASCII 码值要小。`lower()`函数通过将大写字母的 ASCII 码值转换为对应的小写字母的 ASCII 码值来实现大小写转换。 - 字符编码:在 Python 中,字符串实际上是由一系列字节组成的序列,这些字节对应于字符的编码。常见的编码方式包括 UTF-8、ASCII 等。`lower()`函数对于不同编码的字符串可能会有不同的行为,具体取决于该编码是否支持大小写转换。

2023-08-21

预测模型与数据分析.md

学习目标 通过本课程的学习,您将能够: 1. 理解预测模型的概念、作用和应用领域。 2. 掌握常见的预测模型算法,如线性回归、决策树、随机森林等。 3. 学会收集、处理和准备数据,以用于模型训练和预测。 4. 实际搭建预测模型,进行训练、评估和优化。 5. 在商业、金融、医疗等领域中应用预测模型解决实际问题。

2023-08-16

Java面试题精选与解析.md

课程简介 欢迎参加本次Java面试题课程!作为一门广泛应用的编程语言,Java在各个领域中都有着重要的地位。无论您是准备面试,还是想巩固自己的Java知识,本课程将为您呈现一系列经典的Java面试题目,并详细解析每个问题的答案和背后的原理。 学习目标 通过本课程的学习,您将能够: 掌握Java核心概念和基础知识。 理解Java面试常见题型和解题思路。 提升解决问题的编程能力和思维逻辑。 准备充分,信心满满地应对Java相关的面试。

2023-08-16

Python爬虫课程:网络数据采集与分析-课件脚本

学习目标 通过本课程的学习,您将能够: 1. 理解人工智能的定义、历史和基本概念。 2. 掌握人工智能的核心技术,包括机器学习、深度学习和自然语言处理。 3. 了解人工智能在各个领域的应用,如医疗、金融、交通等。 4. 探讨人工智能发展过程中的伦理和社会问题。 5. 展望人工智能的未来发展方向和挑战。

2023-08-16

人工智能课程:探索智能的未来 课程脚本设计,可用于大学课件制作

人工智能课程:探索智能的未来 课程脚本设计,可用于大学课件制作 人工智能课程:探索智能的未来 课程脚本设计,可用于大学课件制作 通过本课程的学习,您将能够: 1. 理解人工智能的定义、历史和基本概念。 2. 掌握人工智能的核心技术,包括机器学习、深度学习和自然语言处理。 3. 了解人工智能在各个领域的应用,如医疗、金融、交通等。 4. 探讨人工智能发展过程中的伦理和社会问题。 5. 展望人工智能的未来发展方向和挑战。

2023-08-16

网页设计大作业:打造创意与功能兼具的旅游信息网站

六、预期学习成果与意义 通过本次大作业,学生将能够: - 理解网页设计与开发的基本流程和技术; - 运用创意和设计原则,创造具有独特风格的网站; - 掌握用户体验设计,提供用户友好的交互界面; - 提高项目管理、创新思维和团队协作能力。 该大作业将使学生在实际项目中获得丰富经验,培养创意和技术能力,为未来的职业发展和学术研究打下坚实基础。

2023-08-15

计算机课程设计脚本:构建实用的网络安全管理系统.md

课程设计背景与目标 随着互联网的快速发展,网络安全问题日益突出,对于企业和个人来说,保护网络系统的安全性变得尤为重要。本课程设计旨在引导学生构建一个实用的网络安全管理系统,通过设计、开发和测试系统,培养学生在网络安全领域的实际应用能力。

2023-08-15

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除