万物皆非-CSDN博客

原创 python网络爬虫与数据采集

requests库是python爬取网页的第三方库。特点是简单而且简洁。

2022-10-03 10:01:52 702

原创数据分析笔记03 Numpy统计分析

Numpy统计分析一.数据读写1.（二进制）保存文件2.（二进制）读取文件生成的文件如下：‘============================================================================’文本文件读写3.保存为txt文件，并导出保存的文件如下：二、简单数据分析1.排序代码及运行结果：2.间接排序代码实现：3.重复/去重代码实现：...

2021-10-23 09:29:52 158

原创数据分析笔记02 Numpy矩阵以及通用函数

一、Numpy矩阵1.创建矩阵合成矩阵代码实现：2.矩阵运算数组运算与矩阵运算的对比：二、通用函数

2021-10-21 21:03:30 165

原创数据分析笔记01 Numpy ndarray的使用、os模块

Numpy ndarray的使用对文件进行处理，首先要调用os模块import os1.熟悉ndarray的使用具体代码及运行结果：其他修改、创建的方法：具体代码以及实现：3.数组的数据类型数据类型转换：代码实现：4.生成随机数生成随机数的函数都在random子模块下常用函数如下：其他函数：5.数组的索引、变换6.数组展平ravel可以直接横向展平，但是flatten可以提供参数实现横向纵向展平代码及运行结果：7.数组的组合8.切割

2021-10-21 20:10:38 160

原创 python爬虫实战学习--泰迪笔记3

第四模块常规动态网页爬取4.1 概述静态网页：完全可以直接获取网页源代码动态网页：网络信息是动态的，无法直接提取。主流的两种方法：4.2 逆向分析爬取动态网页核心：跟踪操作行为，提取有价值的信息，进行合理调动具体步骤如下：代码实现：4.3.1 Selenium打开浏览对象安装下载selenium库和浏览器补丁1.sekenium安装：如下图：...

2021-10-08 19:43:54 572

原创 python爬虫实战基础--泰迪笔记2

静态网页爬取3.1 静态网页爬取概述3.2 使用urllib3实现HTTP请求代码如下：2.头处理代码如下：3.timeout：防止网络不稳定设置timeout参数代码实现：4.重试代码实现:5.完整HTTP请求：代码实现：3.3 使用requests库实现HTTP请求requests简介代码如下（luogu不让俺看查看状态码和编码返回值为概率较大的编码方式，故不一定准确）实现编码如下：请求头、响应头处理代码实现：timeout

2021-10-08 19:37:21 380

原创 Adobe Audition 入门教程

2021-05-12 17:02:34 2857 1

原创 python爬虫基础知识 --泰迪学习笔记

python爬虫基础知识1.1 python网络爬虫实战介绍爬虫：网页、客户端信息提取认识爬虫、反爬虫、配置爬虫环境1.2 认识爬虫浏览器获取反应内容，从而获取网页数据爬虫实际上是上述流程的模拟网络爬虫：也称为网络蜘蛛、网络机器人，是一个自动下载网页的计算机程序或自动化脚本。像一只蜘蛛在互联网上沿着URL的丝线爬行，下载每一个URL所指向的网页，分析页面内容。分类：1.通用网络爬虫2.聚焦网络爬虫3.增量式网络爬虫合法性与robots协议1.3 认识反爬虫反爬虫的

2021-04-29 00:27:47 443 2

原创 python编程基础二

第四模块字符串、字典（本文的大部分干货、笔记以及注意事项都在代码中注释）4.1字符串索引切片字符串相当于定义一段字符序列。字符串中的元素不可变。代码如下：#字符串string1 = 'wz'string2 = "wz"#单引号和双引号均不可以实现多行字符串定义print (string2)#wzstring3 = '''wz''' #三引号可以实现多行字符串的定义print(string3)#打印出w//z#多行注释选中后按CTRL+？键#统一缩进选中后按tab键#反

2021-04-11 17:53:29 267

原创 list方法函数

常用函数：常用方法：

2021-04-03 20:21:55 127

原创 python程序设计基础

第一模块准备工作1.1 认识python，并学习了python的优势及其组成部分1.2 搭建python环境。实际开发环境包含三部分：python解释器（程序运行基础）、第三方类库（功能拓展）、编译器（提高编译效率）。1.3 安装编译器PyCharm。1.4 学习PyCharm的使用方法，并完成并运行以下代码。第二模块列表操作2.1 完成了第一个python程序如下：2.2 python固定数据类型基本数据类型完成了如下代码：2.3 列表构建及其索引列表：1.列表中每个

2021-04-03 17:54:00 5661 2