自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 五大压缩思想

压缩的官方定义为:一种通过特定的算法来减小计算机文件大小的机制。这种机制是一种很方便的发明,尤其是对网络用户,因为它可以减小文件的字节总数,使文件能够通过较慢的互联网连接实现更快传输,此外还可以减少文件的磁盘占用空间。简单来说,压缩实质是对冗余信息的一种简化表示。由于当前数据可以用一种更简洁的方式表示,进而用更小的存储空间即可存储,因此才有了压缩的存在。

2024-09-25 17:49:17 557

原创 LZ77压缩算法

LZ77算法是一种无损数据压缩算法,由Abraham Lempel和Jacob Ziv于1977年提出。它是一种字典编码方法,通过查找数据中重复出现的字符串,并用较短的标记来替代这些字符串,从而实现压缩。

2024-09-24 18:05:24 899

原创 Adaboost-集成学习分类器

AdaBoost(Adaptive Boosting)是一种集成学习算法,该算法的泛化逻辑为:通过一些简单的规则的整合得到一个整体,使得整体的性能比任何一个部分都高。该算法是由Yoav Freund和Robert Schapire在1995年提出。它通过组合多个弱学习器来构建一个强学习器,特别关注那些之前被错误分类的数据点,确保这些点在后续的训练中得到更多的注意,从而提高整体的学习效果。

2024-09-23 14:40:34 730

原创 ICA-从混合信号中分解提取源信号

ICA的基本假设是观测到的多维信号是若干个独立成分的线性组合,这些独立成分在统计上是相互独立的,且至少有一个是非高斯分布的。这些声音信号在时间上是混合的,我们的目标是使用ICA将这些混合的信号分离,恢复出每个人的声音。白化是ICA分析的一个重要步骤,它简化了后续的分离过程。使用最终的权重矩阵 \( W \) 将白化后的信号投影回,得到分离后的信号矩阵 \( S \) ,其中每一行代表一个分离出的独立信号。:ICA假设观测到的信号是由统计独立的源信号线性组合而成,这些源信号是未知的,但它们之间没有相互关系。

2024-09-20 15:07:18 775

原创 信号处理 - EMD分解

MEEMD在检测出CEEMD分解的异常分量之后,直接进行EMD分解,不仅能够抑制EMD分解过程中的模态混淆,而且减小了计算量,缩小了重构误差。:针对二维信号,如图像,提出了二维EMD的实现方法。通过理论和计算实践分析比较了不同的插值方式,提出了结合三角剖分插值和径向基函数插值的BEMD实现方法,以及针对径向基函数插值方式的快速方法,提高了计算速度。:通过在信号中加入白噪声,然后对每个加噪后的信号进行EMD分解,最后将所有分解得到的IMFs进行总体平均,以消除噪声的影响。

2024-09-19 13:42:27 741

原创 层次聚类法:凝聚和分裂

凝聚层次聚类是一种自底向上的方法,它开始时将每个数据点视为一个单独的簇,然后在算法的每一步中找出距离最近的两个簇进行合并,直到达到预设的簇数量或某个终止条件。分裂层次聚类是一种自顶向下的方法,它开始时将所有数据点视为一个簇,然后在每一步中选择最合适的簇进行分裂,直到每个数据点都是一个单独的簇或达到预设的簇数量。最后,继续合并剩余的簇,直到所有数据点都被聚成一个大簇。首先,将每个数据点视为一个独立的聚类簇,即初始时有七个聚类簇:{A}, {B}, {C}, {D}, {E}, {F}, {G}。

2024-09-18 09:25:45 874

原创 FP-growth频繁项快速搜索

FP-growth算法的核心是构建一个称为“FP树”的紧凑数据结构,通过两次扫描数据库来构建这棵树,然后通过递归地挖掘条件模式基(Conditional Pattern Bases)来发现频繁项集。例如,在推荐系统中,可以通过挖掘用户购买行为的频繁项集,发现用户的购买习惯,从而进行个性化推荐。3. **挖掘频繁项集**:从FP树中递归挖掘频繁项集,对于每个项,找到其条件模式基,构建条件FP树,然后递归挖掘。1. **第一次扫描**:统计所有项的出现次数,并根据支持度阈值删除不满足条件的项。

2024-09-18 09:06:45 283

原创 STL分解

其中,趋势成分反映了数据的长期变化趋势,季节成分反映了数据的周期性变化,而残差成分则是剔除趋势和季节性后的数据,反映了数据的随机波动。STL分解适用于加法模型,如果数据更适合乘法模型(即季节性和趋势的幅度随时间变化),则需要对数据进行对数转换后进行STL分解,然后再转换回原始尺度。2. 设置参数:确定季节性周期(`period`),季节性平滑参数(`season`),趋势平滑参数(`trend`)。- 趋势平滑:对去周期后的数据进行Loess平滑,以估计趋势成分。- 去周期:从去趋势数据中去除季节性成分。

2024-09-13 17:45:18 343

原创 SLPA社区发现算法

假设有一个简单的网络,包含节点A、B、C、D、E,其中A与B、C相连,B与C、D相连,C与D、E相连,D与E相连。最终,可能会形成如A{1}, B{1,2}, C{2}, D{2}, E{2}的标签分布,表示社区结构。其中,节点B拥有两个标签{1,2}是因为在算法的迭代过程中,B节点从其邻居节点(作为Speaker)接收到了这两种标签。:每个节点(A、B、C、D、E)被赋予一个唯一的标签,例如A=1,B=2,C=3,D=4,E=5。- 节点标签的初始化:初始标签的分配可能影响最终的社区发现结果。

2024-09-12 11:49:52 340

原创 MTF压缩

第一个A:移动到前,列表 = `[A, B, C, D]`,编码 = `0`- 第二个A:移动到前,列表 = `[A, B, C, D]`,编码 = `0`- 第三个A:移动到前,列表 = `[A, B, C, D]`,编码 = `0`- 第四个A:移动到前,列表 = `[A, B, C, D]`,编码 = `0`- 第一个B:移动到前,列表 = `[B, A, C, D]`,编码 = `1`- 第二个A:移动到前,列表 = `[A, D, C, B]`,编码 = `0`

2024-09-10 13:53:19 374

原创 BWT压缩

1. **输入字符串**:首先,输入一个待压缩的字符串,并在字符串的末尾添加一个特殊的结束符号(如`$`),以确保字符串有一个明确的结束。4. **输出变换结果**:提取排序后的每一行的最后一个字符,将这些字符连起来形成一个新的字符串,这就是BWT变换的输出。3. **提取最后一列**:将排序后的每一行的最后一个字符提取出来,形成一个新的字符串,这就是BWT变换的结果。2. **生成所有后缀**:生成输入字符串的所有后缀,包括原始字符串本身和通过循环移位得到的后缀。2. **字典排序**:排序后得到。

2024-09-09 13:49:06 416

原创 机器学习 - 结合具体应用的SVD分解

在这里,我们选取200个动力电池数据作为样本,每个样本选择9个梯次的数据,得到一个200行,9列的矩阵,首先属于容量衰减过快的数据有66个,构建成一个8*9的矩阵,对该矩阵进行SVD分解,得到左奇异矩阵和右奇异矩阵,其中左奇异矩阵的行数为9,右奇异矩阵的行数为8,即左奇异矩阵有9个奇异向量,右奇异矩阵有8个奇异向量,在使用时,根据需要,选取需要的奇异向量,左奇异向量表示的是该8*9矩阵的特征,右奇异向量表示的是该矩阵与逆矩阵乘积矩阵的特征。

2023-11-14 23:49:21 62 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除