HUSTのstupid bot-CSDN博客

原创时间序列分析：探索平稳性和自相关性

本文使用的AirPassengers数据集记录了1949年1月至1960年12月期间国际航空公司的月度乘客人数。这是一个经典的时间序列数据集，经常用于时间序列分析和建模的示例。数据集展示了明显的趋势和季节性模式，是研究非平稳时间序列的理想案例。# 下载AirPassengers数据集# 可视化时间序列plt.show()通过对AirPassengers数据集的ADF和KPSS检验，我们得出了明确的结论，即该时间序列具有显著的非平稳性。

2024-07-14 17:04:41 1191

原创深度学习：ResNet网络与bottleneck架构

ResNet（Residual Neural Network）是由何恺明等人在2015年提出的一种深度卷积神经网络。它的核心思想是引入残差块（Residual Block），解决了深度神经网络中常见的梯度消失和梯度爆炸问题，从而使得网络可以更深。残差学习：通过引入恒等映射（Identity Mapping），使网络能够更容易地学习到恒等函数，从而减轻梯度消失问题。跳跃连接：残差块通过跳跃连接（Skip Connection）直接将输入传递到输出，提高了信息传递的效率。更深的网络。

2024-07-14 13:36:04 3130

原创深度学习：NiN网络与实验拓展

NiN（Network in Network）是2013年由Lin Min等人提出的一种新型卷积神经网络结构。与传统卷积神经网络相比，NiN在每个卷积层之后引入了1x1卷积层，以增强网络的表达能力和非线性特性。通过实验结果可以看出，1x1卷积层在NiN块中起到了关键作用。删除其中一个1x1卷积层会显著降低模型的表达能力，从而影响模型的性能。NiN网络通过增加1x1卷积层，增强了网络的非线性和表达能力，使其能够更好地提取和组合复杂的特征，从而提高模型的准确性和泛化能力。

2024-07-12 13:20:08 1431

原创时间序列分析论文翻译与笔记：The correct way to start an Exponential Moving Average (EMA)

在之前的笔记中，我们初步认识了指数移动平均（），本文将通过翻译一篇在2017年的一篇博客，讨论如何确保移动平均数能够通过识别记录信息的时长，来适应新的信息。（原文的代码为R，本文将补充py代码）

2024-07-12 11:19:09 1710

原创时间序列分析基础：采样与指数加权移动平均

时间序列分析在各个领域中都有着广泛的应用，从金融市场的股票价格预测到气象数据的变化趋势分析，时间序列数据无处不在。处理和分析这些数据的方法有很多，其中上采样、下采样以及指数加权移动平均（EWMA）是常用的技术。上采样和下采样用于调整数据的时间分辨率，而EWMA则用于平滑数据，去除噪声，提高信号的质量。这些方法在时间序列分析中具有重要的地位，因为它们帮助我们更好地理解和解释数据的内在规律，为预测和决策提供了可靠的依据。

2024-07-11 15:29:14 2312

原创深度学习：实现和训练VGG网络

VGG块由多个卷积层和一个最大池化层组成。我们定义了两个版本的VGG网络，分别为VGG-11和VGG-19。# VGG-11通过这次学习，我们了解了如何实现VGG11和VGG19网络，并设置合适的训练参数。文献中关于学习率、动量等参数的建议对模型的训练效果有重要影响。在实际应用中，我们可以根据具体需求调整这些参数，以达到最佳效果。同时，我们也认识到在选择网络深度时需要在性能和计算复杂度之间进行权衡。

2024-07-11 13:29:38 1979 2

原创统计学论文翻译与笔记：《Revisiting Francis Galton’s Forecasting Competition》

1. Forecast competitions (预测竞赛)：预测竞赛是指参与者或团队进行预测任务并相互竞争准确性的一种活动。其目的是评估和比较不同预测方法或模型的性能。在这类竞赛中，参与者需要对未来事件或数据趋势进行预测，通常会根据预测的准确性进行评分和排名。2. Two-piece distributions (两部分分布)：两部分分布是一种统计分布，用于描述数据的非对称性。它通常由两个不同的部分组成，每个部分有不同的参数，以捕捉数据分布的不同特性。这种分布可以更好地描述具有偏斜特性的实际数据。例

2024-07-10 16:21:11 1648

原创自然语言处理：使用NLTK库进行文本分析

Python的NLTK（Natural Language Toolkit）库为语言处理提供了强大的工具和资源。本学习笔记将通过一个实际的例子，介绍如何使用NLTK进行基本的文本分析任务。NLTK作为一个功能强大的语言处理工具，为我们提供了探索语言的丰富资源和方法。随着技术的深入，我们期待解锁更多自然语言处理的秘密，开启语言和计算机之间更深层次的交流。

2024-04-04 15:28:44 1526 1

原创自然语言处理：Python的spaCy库及文章人名统计

在不断发展的自然语言处理领域中，Python的spaCy库以其强大和用户友好的特性脱颖而出。本学习笔记深入探讨利用spaCy进行基本NLP任务，包括分词、句子切分、词性标注、命名实体识别，以及一个实际应用示例——识别文本中的人名。

2024-04-04 15:14:30 2074 1

原创机器学习实战：决策树与随机森林预测心脏病分类问题

决策树与随机森林预测心脏病分类

2024-03-09 20:01:00 3394

原创 skimage库：Python图像处理入门

在本篇学习笔记中，我们将深入浅出地探索图像处理的基本概念和技术。从最初的图像读取、尺寸获取，到颜色通道分离，再到更高级的图像灰度化、二值化、边缘检测和高斯滤波，每一步都配有直观的代码示例和结果展示。通过操作真实的图像数据—这里以一张猫和一张狗的图像为例—我们不仅会学习如何使用Python和。首先导入需要的库，然后用io.imread读取图片，获取基本信息 (高度，宽度，颜色通道)。库进行图像处理，还将了解到各种技术如何帮助我们提取图像信息、减少噪声并突出重要特征。

2024-03-01 20:57:07 893

原创实战NLP：文本数据处理到词向量的转化

本篇学习笔记专注于自然语言处理的实践应用，涵盖从原始文本数据的预处理到词向量表示的转化的整个流程。我们将通过Python和相关库（如NLTK, scikit-learn, Gensim）逐步演示如何对文本数据进行清洗、分词，以及应用N-Grams、TF-IDF、余弦相似度、K-Means聚类、LDA主题建模和Word2Vec模型等核心NLP技术。旨在为读者提供一套清晰的方法论和代码实例，帮助理解和实现文本数据的有效处理和分析。

2024-03-01 19:31:18 1544 1

原创机器学习入门（词袋模型）

因此，我们需要将文本转换成机器学习算法可以理解的形式，这就是文本预处理和特征提取步骤的用武之地。在本文中，我们将探讨如何使用Python进行文本预处理，包括去除停用词、标准化文本等步骤，以及如何利用词袋模型（Bag of Words, BoW）进行特征提取。词袋模型是自然语言处理（NLP）中最基本的特征提取技术之一，它将文本转换为数值特征向量，使得文本数据可以被机器学习模型有效处理。我们将通过一个简单的示例，展示如何将一组文档（可以是任何文本数据）通过预处理步骤转换成清洁的格式，并使用。

2024-02-28 19:19:18 976 1

HUSTGO的博客