「已注销」-CSDN博客

原创三、数据清洗与准备-处理缺失值

""" pandas使用浮点值NaN来表示缺失值 ▶知识点1：NA处理方法：函数名描述 -------------------------------------------------------------------------------------------- dropna 根据每个标签的值是否是缺失数据来筛选轴标签，并根据允许缺失的数据量来确定阈值 .

2021-12-03 17:49:00 151

原创二、Pandas-15.唯一值、计数和成员属性

import pandas as pd""" ▶知识点1：唯一值、计数和集合成员属性方法方法描述 -------------------------------------------------------------------------------------- isin 计算表征Series中每个值是否包含于传入序列的布尔值数组 matc.

2021-12-03 16:42:23 315

""" pandas对象装配了一个常用数学、统计学方法的集合。其中大部分属于【归约】或【汇总统计】的类别，这些方法从DataFrame的行或列中抽取一个Series或一系列值得单个值（如总和或平均值）与Numpy数组中的类似方法相比，它们内建了处理缺失值的功能"""import numpy as npimport pandas as pddf_1 = pd.DataFrame([[1.1, 2.2, np.nan], [np.nan, 3.3, 4.4], [5.5,.

2021-12-03 15:34:08 729

原创二、Pandas-12.含有重复标签的轴索引

""" 目前为止所见过的示例中，轴索引都是唯一的（索引值），尽管pandas函数（比如reindex）需要标签是唯一的，但这个并不是强制性的"""import numpy as npimport pandas as pdobj = pd.Series(range(5), index=["A", "A", "B", "C", "C"])print(obj)# ▶知识点1：is_unique可以判断标签是否唯一print(obj.index.is_unique) # False#.

2021-12-03 14:40:42 188

原创二、Pandas-11.排序与排名

""" -------------------------------------------排序--------------------------------------------- 根据某些准则对数据进行排序是另一个重要的内建操作。如果需要按行或列索引进行字典型排序，需要使用sort_indnex方法，该方法返回一个新的、排序好的对象"""import numpy as npimport pandas as pdobj = pd.Series(np.arange.

2021-12-03 14:17:42 1043

原创二、Pandas-10.函数应用与映射

""" ▶知识点1：Numpy的通用函数（逐元素数组方法）对pandas也有效，关于通用函数最下面做了相关补充回顾"""import numpy as npimport pandas as pddf_1 = pd.DataFrame(np.random.randn(4, 3), columns=list("BDE"), index=["XiaoMing", "XiaoHong", "XiaoYing", "XiaoKe"])print(df_1) # np.random.randn(.

2021-12-03 11:51:25 197

原创二、Pandas-9.DataFrame和Series间的操作

import numpy as npimport pandas as pdarr = np.arange(12.).reshape((3, 4))print(arr)"""[[ 0. 1. 2. 3.] [ 4. 5. 6. 7.] [ 8. 9. 10. 11.]]"""print(arr - arr[0]) # ▶知识点1：当从arr中减去arr[0]时，减法会在每一行都进行操作，这就是所谓的广播机制"""[[0. 0. 0. 0.] [4. 4. 4. 4..

2021-12-03 11:21:25 150

原创二、Pandas-8.算术与数据对齐

""" 不同索引的对象之间的算术行为是pandas提供给一些应用的一项重要特性。当你将对象相加时，如果存在某个索引对不相同，则返回结果的索引将是索引对的并集。对数据库用户来说，这个特性类似于索引标签的自动外连接"""import numpy as npimport pandas as pds1 = pd.Series([1, 2, 3, 4], index=["A", "B", "C", "D"])s2 = pd.Series([5.1, 6.1, 7.1, 8.1.

2021-12-03 10:55:12 248

原创二、Pandas-7.整数索引

""" 在pandas对象上使用整数索引对新用户来说经常会产生歧义，这是因为它在和列表、元组等Python内建数据结构上进行索引有些许不同"""import numpy as npimport pandas as pdobj = pd.Series(np.arange(4), index=["A", "B", "C", "D"])print(obj)print(obj[1]) # 1print(obj[1:3])print(obj[-1]) # 3""" 为了保.

2021-12-03 09:48:02 858

原创二、Pandas-6.索引、选择与过滤

""" Series的索引与Numpy数组索引的功能类似，只不过Series的索引值可以不仅仅是整数"""import pandas as pdimport numpy as npobj = pd.Series(np.arange(4.), index=["Zero", "One", "Two", "Three"])print(obj)"""Zero 0.0One 1.0Two 2.0Three 3.0dtype: float64""".

2021-12-03 09:36:27 784

原创二、Pandas-5.轴向上删除条目

""" drop：在轴向上删除一个或更多的条目，返回一个含有指示值或轴向上删除值的新对象"""import numpy as npimport pandas as pdobj = pd.Series(np.arange(5), index=["Zero", "One", "Two", "Three", "Four"])print(obj)"""Zero 0One 1Two 2Three 3Four 4dtype: int32"".

2021-12-02 17:52:39 97

原创二、Pandas-4.重建索引

""" reindex：用于创建一个符合新索引的新对象"""import numpy as npimport pandas as pdobj = pd.Series([1, 2, 3, 4], index=["One", "Two", "Three", "Four"])print(obj)# ▶知识点1：Series调用reindex方法时，会将数据按照新的索引进行排列，如果某个索引值之前并不存在，则会引入缺失值obj_1 = obj.reindex(["One", "Two",.

2021-12-02 17:29:32 465

原创二、Pandas-3.索引对象

""" 索引对象： pandas中的索引对象是用于存储轴标签和其他元数据的（例如轴名或者标签）在构造Series或DataFrame时，你所使用的任意数组或标签序列都可以在内部转换为索引对象常见的索引对象的方法和属性：方法描述 --------------------------------------------------------------------- appen.

2021-12-02 16:36:10 524

原创二、Pandas-2.Pandas数据结构：DataFrame

""" Pandas常用的两个工具数据结构： 1.Series 2.DataFrame DataFrame： 1.DataFrame表示的是矩阵的数据表，它包含已排序的列集合，每一列可以是不同的值类型（数值、字符串、布尔值等） 2.DataFrame既有行索引，也有列索引，可以被视为一个共享相同索引的Series的字典 3.在DataFrame中，数据被存储为一个以上的二维块，而不是列表、字典或其他一维数组的.

2021-12-02 15:54:23 576

原创二、Pandas-1.pandas数据结构-Series

""" Pandas常用的两个工具数据结构： 1.Series 2.DataFrame Series： Series是一种一维的数组型对象，包含了一个值序列（与Numpy中的类型相似），并且包含了数据标签，称为索引（index）交互式环境中，Series的字符串表示，索引在左边，值在右边。如果不人为的给数据指定索引，默认生成的索引是从0~N-1（N为数据的长度） Series的属性：.

2021-12-02 14:39:48 530

原创一、Numpy-14.伪随机数

""" Numpy.random模块填补了Python内建的random模块的不足，可以高效的生成多种概率分布下的完整样本值数组 Numpy.random中的部分函数列表：函数描述 --------------------------------------------------------------- np.random.seed() 向随机数生成器传递随机状态种子 .

2021-12-02 14:38:33 85

原创一、Numpy-13.线性代数

""" 特殊符号 @ 作为中缀操作符，用于点乘矩阵操作 Numpy.linalg拥有一个矩阵分解得标准函数集，以及其他常用函数常用函数：函数描述 -------------------------------------------------------------------------- np.diag() 将一个方阵的对角（或非对角）元素作为一维数组返回 .

2021-12-02 14:37:56 187

原创一、Numpy-12.排序、唯一值以及集合逻辑

""" np.sort()方法返回的是已经排好序的数组拷贝，而不是对原数组按位置排序"""import numpy as nparr_1 = np.array([1, 4, 3, 6, 2, 5])print(np.sort(arr_1))arr_2 = np.random.randn(6)print(arr_2)arr_2.sort() # 这种方法会修改原数组print(arr_2)# 唯一值：np.unique()，返回的是一数组中【去重】并【排序】之后形成的数组，.

2021-12-02 14:37:10 313

原创一、Numpy-11.数学统计方法

""" 基础数组统计方法：方法描述 ---------------------------------------------- np.sum() 沿着轴向计算所有元素的累和，0长度的数组，累和为0 np.mean() 算数平均值，0长度的数组平均值为NaN np.std() 标准差 np.var() .

2021-12-02 14:35:44 96

原创一、Numpy-10.条件逻辑操作数组

""" np.where函数是三元表达式 x if condition else y的向量化版本 np.where(condition,result_1,result_2)"""import numpy as nparr_1 = np.arange(32).reshape((4, 8))print(np.where(arr_1 > 5, 4, 8)) # 数组中，小于5的全替换成4，大于5的全替换成8"""[[8 8 8 8 8 8 4 4] [4 4 4 4 4.

2021-12-02 14:35:11 94

原创一、Numpy-9.使用数组进行面向数组编程

""" 使用Numpy数组可以利用简单的数组表达式完成多种数据操作任务，无需写大量循环，这种利用数组表达式来替代显示循环的方法称为向量化"""import numpy as npimport matplotlib.pyplot as pltpoints = np.arange(-5, 5, 0.01)xs, ys = np.meshgrid(points, points)z = np.sqrt(xs ** 2, ys ** 2)plt.imshow(z, cmap=plt.cm..

2021-12-02 14:34:33 86

原创一、Numpy-8.通用函数

""" 通用函数：即ufunc，是一种在ndarray数据中进行逐元素操作的函数某些简单函数接收一个或多个标量数值，并产生一个或多个标量结果，而通用函数就是对这些简单函数的向量化封装一元通用函数：函数名描述 ------------------------------------------------------- np.abs(ar.

2021-12-02 14:32:54 149

原创一、Numpy-7.数组转置与换轴

""" 转置是一种特殊的数据重组形式，可以返回底层数据的视图而不需要复制任何内容。数组拥有transpose方法，也有特殊的T属性"""import numpy as nparr_1 = np.arange(32).reshape((4, 8))print(arr_1)print(arr_1.T)# 对于更高维度的数组，transpose方法可以接收包含轴编号的元组，用于置换轴arr_2 = np.arange(36).reshape((2, 3, 6))print.

2021-12-02 14:32:09 198

原创一、Numpy-6.神奇索引

""" 神奇索引是Numpy中的术语，用于描述使用整数数组进行数据索引"""import numpy as nparr = np.empty((8, 4))for i in range(8): arr[i] = iprint(arr)# 可以简单的通过一个包含指明所需顺序的列表或数组来选出符合特定顺序的子集print(arr[[4, 3, 0, 6]])# 如果使用负的索引，将从尾部进行选择print(arr[[-3, -5, -7]])# 传递多个索引数组时情况不.

2021-12-02 14:31:05 463

原创一、Numpy-5.索引和切片

""" 索引： 1.一维数组的索引和Python的列表的功能差不多 2.对于高维数组，各索引位置上的元素不再是标量，而是相应的n维数组获取其中的元素可以使用【以逗号隔开的索引列表】来选取"""import numpy as nparr_1 = np.array([[1, 2, 3, 4], [5, 6, 7, 8]])print(arr_1)print(arr_1[0]) # [1 2 3 4]print(arr_1[0, 1].

2021-12-02 14:30:27 80

原创一、Numpy-4.数组的运算

""" 矢量化：ndarray(数组)很重要，可以使你不用编写循环就可以对数据执行批量运算大小相等的数组之间的任何算术运算都会将运算应用到元素级大小相同的数组之间的比较会生成布尔值数组不同大小的数组之间的运算叫做广播，后续会涉及到"""import numpy as nparr_1 = np.array([1, 2, 3, 4])print(arr_1) # [1 2 3 4]print(arr_1 + arr_1) # [2 4 6 8]pri.

2021-12-02 14:29:43 62

原创一、Numpy-3.数组的数据类型

""" dtype(数据类型)是一个特殊的对象，它含有ndarray将一块内存解释为特定数据类型所需的信息 dtype是Numpy灵活交互其他系统的源泉之一。多数情况下，它们直接映射到相应的机器表示，这使得"读写磁盘上的二进制数据流"以及"集成低级语言代码"等工作变得更加简单。数值型dtype的命名方式相同：一个类型名(如float或int)，后面跟一个用于表示各元素位长的数字。标准的双精度浮点值（即Python中的float对象）需要占用8字节（即64位.

2021-12-02 14:28:19 354

原创一、Numpy-2.创建数组

""" Numpy最重要的一个特点就是其N维数组对象（即ndarray），该对象是一个快速而灵活的大数据集容器。可以利用这种数组对整块数据执行一些数学运算，其语法跟标量元素之间的运算一样"""import numpy as npdata = np.random.randn(2, 3)print(data)print(data * 10)print(data + data)""" ndarray是一个通用的同构数据多维容器，也就是说，其中的所有元素必须使相同类型.

2021-12-02 14:23:09 146

原创一、Numpy-1.概念

""" Numpy是Python数值计算最重要的基础包。大多数提供科学计算的包都是用numpy的数组作为构建基础 Numpy的部分功能如下： 1.ndarray：一个具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组 2.用于对整组数据进行快速运算的标准数学函数（无需编写循环） 3.用于读写磁盘数据的工具以及用于操作内存映射文件的工具 4.线性代数、随机数生成以及傅里叶变换功能 5.用于集成由C、C++.

2021-12-02 14:19:59 160

原创 1.图像处理的基本操作

import cv2"""1.读取图像：image = cv2.imread(filename,flags) image：是imread()方法的返回值，返回的是读取到的图像 filename：要读取的图像的完整文件名，注意：路径中不能出现中文 flags：读取图像颜色类型的标记，默认为1，表示彩色，0-表示灰度图像"""image = cv2.imread('./ImgFile/Conan.jpg')# image = cv2.imrea.

2021-11-24 00:03:04 126

qq_43818400的博客