自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 资源 (1)
  • 收藏
  • 关注

原创 【机器学习】为什么用正则化技术防止模型过拟合

综上所述,正则化技术通过简化模型复杂度、减少参数数量、使用L1和L2正则化、使模型更平滑以及控制模型复杂度等方法来提高防止过拟合的效果。这些措施有助于降低模型在训练集上的性能与在测试集上的性能之间的差距,从而提高模型的泛化能力。1.简化模型复杂度:正则化通过在模型的损失函数中添加一些惩罚项,使得模型在训练过程中不仅关注于最小化经验风险(即数据误差),还关注于最小化结构风险(即模型的复杂度)。减少参数数量:正则化可以约束模型参数,使其不会过大,进而减少模型中的参数数量。

2024-06-19 17:29:33 56

原创 【机器学习】模型训练loss损失值正常下降,但是acc准确率精度却为零0

如果模型在训练时使用了不同的标签集,或者预测时标签的处理方式与训练时不一致,那么精度可能会受到影响。2.类别不平衡:如果数据集中某些类别的样本数量远远多于其他类别,而模型又没有得到适当的处理(例如使用权重调整、重采样等),那么模型可能会偏向于预测数量最多的类别,导致其他类别的精度很低甚至为0。例如,在分类任务中,你可能需要确保你的代码正确地计算了精度(即正确分类的样本数除以总样本数)。1.模型性能差:模型可能还没有学习到任何有用的特征或模式,导致它的预测几乎总是错误的。

2024-06-19 15:31:46 71

原创 初始化隐藏状态【h0】和细胞状态【c0】到RNN,LSTM,GRU --OCR(光学字符识别)

这些张量的形状应该是(num_layers * num_directions, batch_size, hidden_size),其中num_layers是LSTM层数,num_directions是LSTM的方向数(对于双向LSTM为2,对于单向LSTM为1),batch_size是批量中的样本数,hidden_size是隐藏层的大小。h0和c0被初始化,可以根据需要使用其他值或策略来初始化它们。img = Image.open(‘00000.jpg’).convert(‘L’) #本地图片一张。

2024-06-19 00:05:46 191

原创 在OCR(光学字符识别)加入ctc_decode 输出每个时间步可能存在的字符

在使用这些函数时,通常需要提供模型的输出概率、序列长度等信息,并设置适当的解码参数(如束大小、空白标记等)。束搜索(Beam Search):在每个时间步上,保留概率最高的几个候选序列(即“束”),并在后续时间步上扩展这些序列。总结来说,ctc_decode 是将 CTC 模型输出转换为最终序列的过程,涉及解码策略的选择、解码函数的调用以及后处理步骤。此外,还有一些开源的 CTC 解码库,如 fast-ctc-decode(如参考文章2所述),这些库通常提供了更高效的解码实现和更灵活的配置选项。

2024-06-18 17:25:03 150

原创 OCR(光学字符识别)任务中 字符准确率、单词准确

字符准确率是指OCR系统正确识别出的字符数占总字符数的比例,而单词准确率则是指OCR系统正确识别出的单词数占总单词数的比例。在OCR(光学字符识别)任务中,记录训练准确次数是一个关键步骤,它有助于我们评估模型的性能和优化训练过程。当模型在验证集上的准确率达到或超过设定的阈值时,记录当前的迭代次数或epoch数。根据记录的准确率数据和训练准确次数,分析模型在训练过程中可能存在的问题,如过拟合、欠拟合、梯度消失等。可以将训练准确次数作为模型训练的一个关键指标,用于比较不同模型或不同训练策略的性能。

2024-06-17 23:54:03 171

原创 深度学习-运用transforms方法 对图片增强

transforms方法在图像增强中起到了至关重要的作用,特别是在深度学习的数据预处理阶段。以下是关于transforms方法如何对图片进行增强的详细解释:数据增强的目的数据增强是一种常用的数据预处理技术,通过对训练集进行各种变换和扩增操作,增加训练数据的多样性和丰富性,从而提高模型的泛化能力。其目的是模拟真实世界中的各种场景和变化,帮助模型学习到更多不同的特征和模式,提高模型对于不同样本的适应能力,减少过拟合的风险。

2024-06-17 16:30:03 606

原创 减小模型损失率 需要哪些充足准备

请注意,不同的任务和数据集可能需要不同的策略和参数设置,因此在实际应用中需要进行适当的调整和优化。使用网格搜索(grid search)或随机搜索(random search)等策略来调整模型的超参数,如学习率、批量大小、正则化强度等。例如,对于分类任务,可以使用交叉熵损失;使用合适的初始化策略,如He初始化、Xavier初始化等,来初始化模型的权重和偏置。选择一个合适的优化器,如SGD、Adam、RMSprop等,来更新模型的权重。根据需要,可以调整优化器的参数,如学习率、动量等,以找到最佳的训练效果。

2024-06-17 15:49:07 252

原创 python 实现鼠标滚轮自动下滑加载网页数据

1.没有selenium库 安装 pip install selenium。2.下载webdriver 放在python 根目录里面。【python 实现鼠标滚轮自动下滑加载网页数据】好用代码持续更新中…

2023-09-22 13:40:01 333

原创 遍历年月日

获取当前年月的最大日期。

2023-09-22 00:12:32 120

原创 python百家姓转拼音代码

python百家姓转拼音代码。

2023-09-21 21:46:16 328

c4d_bridge.rar

c4d_bridge.rar

2020-08-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除