机器学习
文章平均质量分 86
行者yy
这个作者很懒,什么都没留下…
展开
-
自回归滑动平均模型ARMA
自回归滑动平均模型ARMA原创 2022-06-05 11:08:34 · 1294 阅读 · 1 评论 -
MA滑动平均模型
滑动平均模型介绍原创 2022-06-04 21:13:50 · 360 阅读 · 0 评论 -
AR(Autoregressive)模型
自回归模型原创 2022-06-04 15:43:02 · 904 阅读 · 0 评论 -
SSA时间序列分解
奇异谱分析(SSA)根据观测到的时间序列构造轨迹矩阵,并对轨迹矩阵进行分解和重构,从而提取出代表原时间序列不同成分的信号,如长期趋势信号、周期信号、噪声信号等,从而进一步对分解得到的信号进行分析。算法流程Step1:根据原始时间序列构建轨迹矩阵XXXStep2:对矩阵X进行奇异值分解:X=∑i=1rσiUiViTX=\sum_{i=1}^{r} \sigma_i U_i V_i^TX=∑i=1rσiUiViTStep3:按奇异值生成rrr个子矩阵:Xi=σiUiViTX_i = \sigma原创 2022-05-11 10:26:21 · 1904 阅读 · 0 评论 -
关联规则挖掘之FPGrowth算法实现
1 关联规则挖掘之FPGrowth算法实现Apriori算法通过利用频繁集的两个特性,过滤了很多无效集合,提高了算法效率。但是算法每一次对频繁项集的筛选都需要扫描一次原始数据集,对于大规模数据集Apriori的算法效率不尽如人意。FPGrowth算法由韩家炜[1]等人于2000年提出,其中FPTree是使得这一算法相比Apriori等算法较为高效的关键数据结构,FPTree将数据库中的所有事务(Transactions)高度压缩成树的路径,所有的频繁项(Frequent Items, FIs)都成为树原创 2022-04-02 19:02:49 · 4845 阅读 · 2 评论 -
Apriori
1 关联规则挖掘1.1 理论定义支持度(support):数据集中包含该项集的数据所占数据集的比例,度量一个集合在原始数据中出现的频率;置信度(confidence):针对关联规则定义如confident(A→B)=support(A∪B)support(A)confident(A\rightarrow B) = \frac{support(A \cup B)}{support(A)}confident(A→B)=support(A)support(A∪B),可以理解为在事件A发生的条件下,原创 2022-03-28 16:19:21 · 833 阅读 · 0 评论 -
编程实现对率回归,并给出西瓜数据集 3.0α 上的结果.
1数据集编号,密度,含糖率,好瓜1,0.697,0.46,是2,0.774,0.376,是3,0.634,0.264,是4,0.608,0.318,是5,0.556,0.215,是6,0.403,0.237,是7,0.481,0.149,是8,0.437,0.211,是9,0.666,0.091,否10,0.243,0.267,否11,0.245,0.057,否12,0.343,0.099,否13,0.639,0.161,否14,0.657,0.198,否15,0.36,0.原创 2021-08-12 11:26:30 · 9305 阅读 · 0 评论 -
常用矩阵运算
给定矩阵Am×nA_{m\times n}Am×n和矩阵Bm×nB_{m \times n}Bm×nA=(a11a12…a1na21a22…a2n⋮⋮⋱⋮am1am2…amn)B=(b11b12…b1nb21b22…b2n⋮⋮⋱⋮bm1bm2…bmn)A=\left(\begin{array}{l}a_{11}&a_{12}&\dots&a_{1n}\\a_{21}&a_{22}&\dots&a_{2n}\\\vdots&\vdots原创 2021-08-11 22:02:27 · 187 阅读 · 0 评论 -
对数几率回归
对数几率回归1.线性回归模型y=wTx+b(1)y=w^T x+ b \tag{1}y=wTx+b(1)www : w=w1,w2,⋯ ,wdw=w_1,w_2,\cdots,w_dw=w1,w2,⋯,wd 系数项xxx : x=x1,x2,⋯ ,xdx={x_1,x_2,\cdots,x_d}x=x1,x2,⋯,xd 样本属性值bbb : 截距项2.对数线性回归将输出标记的对数作为线性模型逼近的目标。ln y=wTx+b(2)ln \,y = w^T x +原创 2021-08-05 22:45:48 · 335 阅读 · 0 评论 -
极大似然估计
0.极大似然估计**理解:**确定合适的参数使得模型对样本的解释性最强。似然的过程就是由样本实际推测模型参数的过程。以下我们分别考虑总体属于离散型和连续型两种情况下的似然函数及其求解方法。1.离散型若总体XXX属于离散型,其分布律P{X=x}=p(x;θ)P\{X=x\}=p(x;\theta)P{X=x}=p(x;θ),θ∈Θ\theta\in \Thetaθ∈Θ的形式为已知。其中xxx是已知的样本值。θ\thetaθ为待估参数,Θ\ThetaΘ是θ\thetaθ可能取值的范围。原创 2021-08-04 10:32:33 · 544 阅读 · 0 评论