- 博客(54)
- 收藏
- 关注
原创 大二下期末
Numpy库是Python用于科学计算的基础包,也是大量Python数学和科学计算包的基础。不少数据处理和分析包都是在Numpy的基础上开发的,如后面介绍的Pandas包。Numpy的核心基础是ndarray(N-dimensional array ,n维数组),即由数据类型相同的元素组成N维数组。
2025-06-05 21:29:54
1459
原创 平滑技术(数据处理,持续更新...)
平滑”是一种用于减少数据中的短期波动、噪声或者异常值的技术,从而更清晰地揭示数据的长期趋势或周期性特征。平滑的主要作用:1.减少噪声。数据中常常包含各种随机噪声或误差,这些误差可能会掩盖数据的真实趋势。平滑可以降低噪声的影响,使数据更加平滑,更容易观察到数据的主要变化趋势。2.揭示趋势。去除数据中的短期波动,使得长期趋势更加明显。对于理解数据的整体走向和进行长期预测非常重要。3.数据可视化。平滑后的数据在图表中更容易呈现清晰的曲线或趋势线。
2025-06-02 17:08:44
1075
原创 PCA主成分分析与Python应用
主成分分析(Principal Compoent Analysis,PCA)是一种常用的统计方法和降维技术,用于从高维数据中提取重要信息,减少数据的维度,同时尽可能保留数据的关键特征和变化信息。PCA通过将原始数据投射到新的坐标系统中,使得新的坐标轴(主成分)能够最大程度地解释数据的方差在PCA中方差是一个非常重要的概念,它可以帮助我们理解数据的分布和变化情况。方差表示数据点与数据集平均值之间的差异程度。方差越大表明数据点在平均值周围的分布越分散:方差越小,数据点越集中在平均值附近。
2025-05-29 21:31:25
908
原创 Python中变量标识的本质
在 Python 中,变量名本质上是一个**标签**,它被绑定到内存中的某个对象。* **`sys` 模块**:提供了与内存管理相关的函数,如 `sys.getrefcount()` 用于获取对象的引用计数,`sys.getsizeof()` 用于获取对象的内存大小。* **对象的内存布局优化**:Python 对象在内存中的布局经过优化,以提高访问速度和内存使用效率。* **内存重用**:Python 会重用某些不可变对象(如小整数、短字符串等)的内存地址,以减少内存分配和释放的开销。
2025-04-27 18:11:23
909
原创 数据预处理中比较重要的知识点
假设有两个已知点 \((x_1, y_1)\) 和 \((x_2, y_2)\),其中 \(x_1 < x_2\)。线性插值的几何意义是:在两点 \((x_1, y_1)\) 和 \((x_2, y_2)\) 之间画一条直线,然后找到这条直线上对应 \(x\) 坐标的位置,得到 \(y\) 值。假设有两个已知点 \((1, 2)\) 和 \((3, 6)\),想要求 \(x = 2\) 处的 \(y\) 值。- \(x_1\) 和 \(x_2\) 是已知点的 \(x\) 坐标。
2025-04-26 12:28:16
310
原创 lqb练习题
小明初始在二维平面的原点,他想前往坐标(233,666)。2.沿着一个圆心在原点(0.0)、以他当前位置到原点的距离为半径的圆的圆周移动,移动方向不限(即顺时针或逆时针移动不限)1.水平向右移动,即沿着x轴正方向移动一定的距离。在这种条件下,他到达目的地最少移动多少单位距离?你只需要输出答案四舍五入到整数的结果。
2025-04-12 17:18:49
180
原创 1.认识C语言
编译器:编译,编译器compiler是一种特殊的程序,主要功能是将人类编写的高级语言代码(如C++,C,Java等)翻译成计算机可以直接执行的机器语言代码(通常是二进制形式)。CTRL + F5 快捷键运行代码(先按Fn不松再按Esc键锁住Fn键,然后可以使用ctrl+f5,或者fn+ctrl+f5直接运行)用计算机的二进制指令写代码(低级语言) —— > 汇编指令(低级语言,用到了助记符)——> B语言 ——> C语言(已经是高级语言)为什么return 整数;float 单精度浮点数。
2025-04-09 22:08:04
332
原创 计算机中的单位
例如,`MB` 通常表示兆字节,但在某些情况下可能会用 `MiB` 表示二进制的兆字节(1 MiB = 1024 KiB)。| 泽字节 | ZB | 1 ZB = 1024 EB = 1,180,591,620,717,411,303,424 字节 || 尧字节 | YB | 1 YB = 1024 ZB = 1,208,925,819,614,629,174,706,176 字节 |
2025-04-09 21:54:40
455
原创 Python数据结构之有序列表
在有序列表中,元素的相对位置取决于它们的基本特征。它们通常以升序或者降序排列,并且我们假设元素之间能进行有意义的比较。有序列表和无序列表(链表)的许多操作都是相同的。
2025-04-04 20:06:47
275
原创 Python数据结构之链表
链表是一种线性数据结构,其元素通过指针(或引用)连接在一起。每个元素称为节点,包含两部分:数据和指向下一个节点的指针。
2025-04-04 11:41:30
301
原创 pandas中的to_period()及其他日期时间相关函数
to_period()` 是 Pandas 中一个非常实用的方法,用于将时间序列数据(如 `datetime` 类型)转换为周期(`Period`)类型。`to_period()` 方法可以将 `datetime` 类型的列转换为指定频率的 `Period` 类型。1. **数据压缩**:`Period` 类型比 `datetime` 类型占用更少的内存。3. **清晰的时间表示**:`Period` 类型可以清晰地表示时间周期,例如季度或月份。### **`to_period()` 的用法**
2025-03-26 18:12:11
376
原创 python主成分分析法1
是一种常见的数据预处理方法,其目的是将数据转换为具有和的分布。这种转换方式使得不同特征的数据具有相同的尺度,从而便于后续的分析和建模。
2025-03-19 20:59:47
778
原创 python鸢尾花
**生成方式**:数据集中的特征是通过实际测量鸢尾花的花萼长度、花萼宽度、花瓣长度和花瓣宽度得到的。- **固定样本**:数据集中的150个样本是固定的,每个样本包含4个特征(花萼长度、花萼宽度、花瓣长度、花瓣宽度)和一个类别标签(鸢尾花的种类)。- **多分类问题**:Iris数据集是一个多分类问题,包含三个不同的类别,适合用于演示分类算法(如k-近邻、决策树、朴素贝叶斯、支持向量机等)。- **固定样本**:Iris数据集中的样本是固定的,每次加载数据集时,样本的特征值和类别标签都不会改变。
2025-03-19 20:57:01
376
原创 数据预测中的相关问题
机器学习通过向数据集学习完成数据预测任务。数据预测就是基于已有数据集,归纳输入变量和输出变量之间的数量关系,并通过预测模型的形式体现。输入变量对应于“数据”,输出变量对应于“答案”,输入变量和输出变量的取值规律对应于“规则”。“规则”是隐藏于数据集中的,需要基于一定的学习策略归纳出来,并通过预测模型的形式体现,该过程称为预测建模。预测建模是数据预测的核心任务。对数值型输出变量的预测称为回归预测,相应的预测模型称为回归预测模型;对分类型输出变量的预测称为分类预测,相应的预测模型称为。
2025-03-13 12:29:20
306
原创 我在学习numpy过程中遇到的一些小问题
也就是说,如果x是一个列表(字典、元组等可迭代对象),使用object.min()是无法求出它的最小值的。(人家对象就没有这个方法)而np.nim(x)是numpy模块中的函数,它可以接受任何可迭代对象作为输入。x.min()是numpy数组对象ndarray的实例方法,flatten() 将数组展平为一维数组(副本)std() 返回数组的标准差。dot() 返回数组的点积。...(很多,上网查吧)
2025-02-27 19:38:47
303
原创 Python中的转义字符
**十六进制字符**:`\xhh`,其中 `hh` 是两位十六进制数。- **八进制字符**:`\ooo`,其中 `ooo` 是三位八进制数。- **`\UXXXXXXXX`**:Unicode 字符(32位)。- **`\uXXXX`**:Unicode 字符(16位)。常用于覆盖当前行的内容。### 5. **双引号(`\"`)和单引号(`\'`)**- **`\N{name}`**:Unicode 字符名。### 7. **垂直制表符(`\v`)**### 8. **反向斜杠(`\b`)**
2025-02-23 19:43:48
386
原创 关于Python的一些基础知识(太阳太阳,持续更新)
print函数有一个end参数,用于指定输出的结尾字符,默认(即不写)是换行符(\n),这就是为什么你在循环中使用print会换行输出的原因了。通过设置end参数,在第一句代码执行完后并不会换行,而是用空格代替换行,所以第二句代码执行后会跟在第一句代码的输出后面。嘿嘿,我用\n代替了换行符(一本正经地乱说),其实效果和省略end参数是一样的。即end设置成一个空字符串,连续输出(其实就是不换行加各行输出没有分隔)用制表符(\t,相当于键盘上的tab键)代替换行符。
2025-02-23 19:42:35
189
原创 我终于搞懂了什么是行翻转,什么是列翻转!!!(此处应该有个怎样的表情)
是将每一行的数据顺序反转,但行的位置不变。也就是说,每一行的开头和结尾互换,中间的数据也相应调整。是将每一列的数据顺序反转,但列的位置不变。也就是说,每一列的顶部和底部互换,中间的数据也相应调整。每一行是一组水平的数据,每一列是一组垂直的数据。每一行的颜色顺序反转,但行的位置保持不变。每一列的颜色顺序反转,但列的位置保持不变。,只改变每一行内部的顺序,行的位置不变。,只改变每一列内部的顺序,列的位置不变。,只是每一行内部的数据顺序反转了。,只是每一列内部的数据顺序反转了。
2025-02-22 17:44:02
176
原创 Python之numpy基础
numpy.eye用于创建一个对角矩阵,对角线上的元素可以是任何值,矩阵可以是方阵也可以不是方阵。numpy.indentity用于生成一个单位矩阵。copy:布尔型,可选项,默认值为True。object:任何具有数组接口方法的对象。shape:数组各维度大小的形状元组。dtype:数组中元素的数据类型。ndarray类的重要对象。size:数组元素总个数。dtype:数据类型。
2025-02-21 21:38:10
326
原创 Python 关于顶层对象
对象是类的实例,封装了数据(属性)和操作数据的方法(行为)。它是面向对象编程的核心概念,通过封装、继承和多态等特性,可以实现代码的复用性和灵活性。在 Python 中,对象是编程的基本单位,几乎所有内容都可以被视为对象。
2025-02-20 16:45:03
1073
原创 Python并发编程,线程进程
线程是程序执行的最小单位,实际上进程只负责分配资源,而利用这些资源执行程序的是线程,也就是说进程是线程的容器,一个进程中最少有一个线程来负责执行程序,同时线程自己不用于系统资源,只需要一点儿在运行中必不可少的资源,但它可与同属一个进程的其它线程共享进程所拥有的全部资源,这就像通过一个QQ软件(一个进程)打开两个窗口(两个线程)跟两个人聊天一样,实现多任务的同时也节省了资源。进程是分配资源的最小单位,一旦创建一个进程就会分配一定的资源,就像两个人聊QQ就需要打开两个QQ软件一样,是比较浪费资源的。
2025-02-19 19:27:00
798
原创 MySQL单表操作
在实际开发中,除了需要对数据进行添加、修改、查询和删除外,有时还需要进行一些进阶操作,例如复制表结构和数据、解决主键冲突、清空数据和去除查询结果中的重复记录,本文章就是来学习这些的。
2025-02-16 21:11:26
825
原创 MySQL之DQL(Data Query Language 数据查询语言)
要用到关键字SELECT基本查询(不带条件)、条件查询(WHERE)、聚合函数(count、max、min、avg、sum)分组查询(GROUP BY)、排序查询(ORDER BY)、分页查询(LIMIT)
2025-02-15 21:15:06
231
原创 MySQL数据库设计
数据库设计要求设计者对数据库设计的过程有深入的了解。数据库设计一般分为6个阶段,分别是需求分析、概念结构设计、逻辑结构设计、物理结构设计、数据库实施和数据库允许与维护。
2025-02-15 14:33:24
214
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人