算法
文章平均质量分 78
意念回复
这个作者很懒,什么都没留下…
展开
-
不均衡样本集的重采样
1 背景 在训练二分类模型时, 例如医疗诊断、 网络入侵检测、 信用卡反诈骗等, 经常会遇到正负样本不均衡的问题。 对于很多分类算法, 如果直接采用不均衡的样本集来进行训练学习, 会存在一些问题。 例如, 如果正负样本比例达到1∶ 99, 则分类器简单地将所有样本都判为负样本就能达到99%的正确率, 显然这并不是我们想要的, 我们想让分类器在正样本和负样本上都有足够的准确率和召回率。2 为什么很多分类模型在训练数据不均衡时会出现问题?本质原因是模型在训练时优化的目标函数和人们在测试...原创 2022-05-12 18:37:17 · 2672 阅读 · 0 评论 -
傅里叶(四):傅立叶变换(FFT)求时间序列的周期
傅里叶级数:在时域是一个周期且连续的函数,而在频域是一个非周期离散的函数。 傅里叶变换:我们接下去要讲的傅里叶变换,则是将一个时域非周期的连续信号,转换为一个在频域非周期的连续信号。首先要来理解什么是频率 : 通用解释为 -----频率,是单位时间内完成周期性变化的次数,是描述周期运动频繁程度的量,常用符号f或ν表示,单位为秒分之一,Hz是频率的基本单位,通常是以1秒完成的动作次数。比如你1秒能吃3个馒头那就记作你吃馒头的频率是3Hz(3赫兹),比如你的眼皮1秒能跳动10次就记作你眼皮...原创 2022-05-08 00:33:17 · 5559 阅读 · 0 评论 -
STL (Seasonal-Trend decomposition procedure based on Loess) 时间序列分解
时间序列分解算法:STL - Treant - 博客园长期趋势(Secular trend, T):长期趋势指现象在较长时期内持续发展变化的一种趋向或状态。 季节变动(Seasonal Variation, S):季节波动是由于季节的变化引起的现象发展水平的规则变动 循环波动(Cyclical Variation, C):循环波动指以若干年为期限,不具严格规则的周期性连续变动 不规则波动(Irregular Variation, I)(R): 不规则波动指由于众多偶然因素对时间序列造...原创 2022-05-06 13:58:34 · 1630 阅读 · 0 评论 -
指数平滑法(Exponential Smoothing,ES)
目录1 指数平滑2 一次指数平滑预测2.1 定义2.2 例题3 二次指数平滑法3.1 定义3.2例题4三次指数平滑预测4.1 定义4.2 例题5 加权系数a的选择1 指数平滑 在做时序预测时,一个显然的思路是:认为离着预测点越近的点,作用越大。比如我这个月体重100斤,去年某个月120斤,显然对于预测下个月体重而言,这个月的数据影响力更大些。假设随着时间变化权重以指数方式下降——最近为0.8,然后0....原创 2020-08-18 22:53:25 · 53194 阅读 · 7 评论 -
模型评估过程中,有哪些主要的验证方法?
交叉验证(也称为“过采样”技术)是数据科学项目的基本要素。 它是一种重采样过程,用于评估机器学习模型并访问该模型对独立测试数据集的性能。在本文中,您可以阅读以下大约8种不同的交叉验证技术,各有其优缺点:Leave p out cross-validation Leave one out cross-validation Holdout cross-validation Repeated random subsampling validation k-fold cross-validation原创 2021-02-02 10:58:41 · 8844 阅读 · 0 评论 -
机器学习算法(二十八):Gan (生成式对抗网络)
生成式对抗网络(GAN, Generative Adversarial Networks )是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一。模型通过框架中(至少)两个模块:生成模型(Generative Model)和判别模型(Discriminative Model)的互相博弈学习产生相当好的输出。原始 GAN理论中,并不要求 G 和 D 都是神经网络,只需要是能拟合相应生成和判别的函数即可。但实用中一般均使用深度神经网络作为 G 和 D 。一个优秀的GAN应用需要有...原创 2022-03-20 12:02:03 · 11156 阅读 · 1 评论 -
字符串匹配算法
字符串匹配算法,是在实际工程中经常遇到的问题,也是各大公司笔试面试的常考题目。此算法通常输入为原字符串(string)和子串(pattern),要求返回子串在原字符串中首次出现的位置。比如原字符串为“ABCDEFG”,子串为“DEF”,则算法返回3。常见的算法包括:BF(Brute Force,暴力检索)、RK(Robin-Karp,哈希检索)、KMP(教科书上最常见算法)、BM(Boyer Moore)、Sunday等。1字符串匹配问题的形式定义文本(Text)是一个长度为 n ...原创 2021-07-20 20:24:49 · 2730 阅读 · 1 评论 -
回溯法
目录1 概念1.1 基本思想:1.2 算法框架1.2.1 问题的解空间1.2.2 回溯法解题的关键要素2 回溯法求解0-1背包问题2.1 问题描述2.2 Python实现1 概念 回溯法(探索与回溯法)是一种选优搜索法,又称为试探法,按选优条件向前搜索,以达到目标。但当探索到某一步时,发现原先选择并不优或达不到目标,就退回一步重新选择,这种走不...原创 2019-09-07 21:36:07 · 352 阅读 · 0 评论 -
python实现全排列(回溯、深度优先搜索)
从n个不同元素中任取m(m≤n)个元素,按照一定的顺序排列起来,叫做从n个不同元素中取出m个元素的一个排列。当m=n时所有的排列情况叫全排列。 公式:全排列数f(n)=n!(定义0!=1)1递归实现全排列(回溯思想)1.1 思想 举个例子,比如你要对a,b,c三个字符进行全排列,那么它的全排列有abc,acb,bac,bca,cba,c...原创 2019-09-10 18:30:47 · 12931 阅读 · 1 评论