自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 深度学习:NiN网络与实验拓展

NiN(Network in Network)是2013年由Lin Min等人提出的一种新型卷积神经网络结构。与传统卷积神经网络相比,NiN在每个卷积层之后引入了1x1卷积层,以增强网络的表达能力和非线性特性。通过实验结果可以看出,1x1卷积层在NiN块中起到了关键作用。删除其中一个1x1卷积层会显著降低模型的表达能力,从而影响模型的性能。NiN网络通过增加1x1卷积层,增强了网络的非线性和表达能力,使其能够更好地提取和组合复杂的特征,从而提高模型的准确性和泛化能力。

2024-07-12 13:20:08 440

原创 时间序列分析论文翻译与笔记:The correct way to start an Exponential Moving Average (EMA)

在之前的笔记中,我们初步认识了指数移动平均(),本文将通过翻译一篇在2017年的一篇博客,讨论如何确保移动平均数能够通过识别记录信息的时长,来适应新的信息。(原文的代码为R,本文将补充py代码)

2024-07-12 11:19:09 959

原创 时间序列分析基础:采样与指数加权移动平均

时间序列分析在各个领域中都有着广泛的应用,从金融市场的股票价格预测到气象数据的变化趋势分析,时间序列数据无处不在。处理和分析这些数据的方法有很多,其中上采样、下采样以及指数加权移动平均(EWMA)是常用的技术。上采样和下采样用于调整数据的时间分辨率,而EWMA则用于平滑数据,去除噪声,提高信号的质量。这些方法在时间序列分析中具有重要的地位,因为它们帮助我们更好地理解和解释数据的内在规律,为预测和决策提供了可靠的依据。

2024-07-11 15:29:14 735

原创 深度学习:实现和训练VGG网络

VGG块由多个卷积层和一个最大池化层组成。我们定义了两个版本的VGG网络,分别为VGG-11和VGG-19。# VGG-11通过这次学习,我们了解了如何实现VGG11和VGG19网络,并设置合适的训练参数。文献中关于学习率、动量等参数的建议对模型的训练效果有重要影响。在实际应用中,我们可以根据具体需求调整这些参数,以达到最佳效果。同时,我们也认识到在选择网络深度时需要在性能和计算复杂度之间进行权衡。

2024-07-11 13:29:38 1583

原创 统计学论文翻译与笔记:《Revisiting Francis Galton’s Forecasting Competition》

1. Forecast competitions (预测竞赛): 预测竞赛是指参与者或团队进行预测任务并相互竞争准确性的一种活动。其目的是评估和比较不同预测方法或模型的性能。在这类竞赛中,参与者需要对未来事件或数据趋势进行预测,通常会根据预测的准确性进行评分和排名。2. Two-piece distributions (两部分分布): 两部分分布是一种统计分布,用于描述数据的非对称性。它通常由两个不同的部分组成,每个部分有不同的参数,以捕捉数据分布的不同特性。这种分布可以更好地描述具有偏斜特性的实际数据。例

2024-07-10 16:21:11 784

原创 自然语言处理:使用NLTK库进行文本分析

Python的NLTK(Natural Language Toolkit)库为语言处理提供了强大的工具和资源。本学习笔记将通过一个实际的例子,介绍如何使用NLTK进行基本的文本分析任务。NLTK作为一个功能强大的语言处理工具,为我们提供了探索语言的丰富资源和方法。随着技术的深入,我们期待解锁更多自然语言处理的秘密,开启语言和计算机之间更深层次的交流。

2024-04-04 15:28:44 450 1

原创 自然语言处理:Python的spaCy库及文章人名统计

在不断发展的自然语言处理领域中,Python的spaCy库以其强大和用户友好的特性脱颖而出。本学习笔记深入探讨利用spaCy进行基本NLP任务,包括分词、句子切分、词性标注、命名实体识别,以及一个实际应用示例——识别文本中的人名。

2024-04-04 15:14:30 926 1

原创 机器学习实战:决策树与随机森林预测心脏病分类问题

决策树与随机森林预测心脏病分类

2024-03-09 20:01:00 1883

原创 skimage库:Python图像处理入门

在本篇学习笔记中,我们将深入浅出地探索图像处理的基本概念和技术。从最初的图像读取、尺寸获取,到颜色通道分离,再到更高级的图像灰度化、二值化、边缘检测和高斯滤波,每一步都配有直观的代码示例和结果展示。通过操作真实的图像数据—这里以一张猫和一张狗的图像为例—我们不仅会学习如何使用Python和。首先导入需要的库,然后用io.imread读取图片,获取基本信息 (高度,宽度,颜色通道)。库进行图像处理,还将了解到各种技术如何帮助我们提取图像信息、减少噪声并突出重要特征。

2024-03-01 20:57:07 598

原创 实战NLP:文本数据处理到词向量的转化

本篇学习笔记专注于自然语言处理的实践应用,涵盖从原始文本数据的预处理到词向量表示的转化的整个流程。我们将通过Python和相关库(如NLTK, scikit-learn, Gensim)逐步演示如何对文本数据进行清洗、分词,以及应用N-Grams、TF-IDF、余弦相似度、K-Means聚类、LDA主题建模和Word2Vec模型等核心NLP技术。旨在为读者提供一套清晰的方法论和代码实例,帮助理解和实现文本数据的有效处理和分析。

2024-03-01 19:31:18 476 1

原创 机器学习入门(词袋模型)

因此,我们需要将文本转换成机器学习算法可以理解的形式,这就是文本预处理和特征提取步骤的用武之地。在本文中,我们将探讨如何使用Python进行文本预处理,包括去除停用词、标准化文本等步骤,以及如何利用词袋模型(Bag of Words, BoW)进行特征提取。词袋模型是自然语言处理(NLP)中最基本的特征提取技术之一,它将文本转换为数值特征向量,使得文本数据可以被机器学习模型有效处理。我们将通过一个简单的示例,展示如何将一组文档(可以是任何文本数据)通过预处理步骤转换成清洁的格式,并使用。

2024-02-28 19:19:18 200 1

原创 力扣100:相同的树

它首先检查两个给定节点是否都为 \texttt{NULL},这是递归的基本情况。如果两个节点都为 \texttt{NULL},则认为这部分树是相同的。如果只有一个节点为 \texttt{NULL},则树不同。如果两个节点都非 \texttt{NULL},则比较它们的值,并递归地比较它们的左子树和右子树。以下是辅助函数 \texttt{createNode} 用于创建新节点,以及主函数 \texttt{main},它创建两棵树并调用 \texttt{isSameTree} 函数来比较它们。

2023-12-12 20:12:42 352

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除