算法
文章平均质量分 78
Jie Qiao
邮箱:358463121@qq.com
展开
-
AES分组对称加密算法学习笔记
State说明S盒变换SubBytes行变换ShiftRows列变换MixColumns与扩展密钥的异或运算AddRoundKey密钥扩展程序Key Expansion参考文献我们首先对AES分组对称加密算法有一个宏观的了解,它的模式主要为 以下是AES主要加密过程的伪代码。Cipher(byte in[4*4] , byte out[4*4] , word w[4*(Nr+1)]原创 2015-08-25 20:36:25 · 2191 阅读 · 0 评论 -
带你理解EM算法
很多时候,我们都要最大化似然度来求得一个参数θθ\theta 的最优值。但是,很多时候,当我们的模型中存在隐变量的时候(比如,一个词所属的主题,聚类问题中样本的类别, etc.),我们的似然度是很难求的。下面是该似然度的式子,其中z表示不可观测的变量,x表示可观测的变量,由于z是不可观测的,所以,要求似然度,我们必须要对z求和或求积分(连续的时候求积分,离散的时候求和)。L(θ)=∑i=1...原创 2018-03-02 11:33:13 · 2128 阅读 · 1 评论 -
prophet:时间序列预测模型原理
prophet:时间序列预测原理介绍prophet是Facebook 开源一款基于 Python 和 R 语言的数据预测工具即“先知”。Facebook 表示,Prophet 相比现有预测工具更加人性化,并且难得地提供 Python 和R的支持。它生成的预测结果足以和专业数据分析师媲美。时间序列模型基本模型 y(t)=g(t)+s(s)+h(t)+ϵty(t)=g(t)+s(s)+h(t)+\e原创 2017-04-16 11:09:05 · 28909 阅读 · 0 评论 -
xgboost中的数学原理
xgboost中的数学原理boosting翻译过来就是提升的意思,通过研究如果将许多个弱分类器集成在一起提升为一个强分类器就是多数boosting算法所研究的内容。其中最为经典的算法就是Adaboost,gdbt,xgboost等算法,本文将从xgboost的原理出发,带大家理解boosting算法。由于xgboost是提升树模型,所以它与决策树是息息相关的,它通过将很多的决策树集成起来,从而得到一原创 2017-03-30 23:29:48 · 11173 阅读 · 2 评论 -
node2vec: 网络结构特征提取
概述论文主要观点本文将抽取网络中节点的特征转化成最优化一个“可能性”目标函数问题,这个“可能性”是该节点可以保存其邻居节点的信息。成果node2vec,如上述,利用SGD优化,高效“随机选择邻居”算法,可让node2vec可适应不同的网络方法模型定义可能性,并且给予两个条件,构成要优化的目标函数; 条件独立性: 节点之间对称性: 最后目标函数: 既然目标函数描述的是此节点能保存相邻转载 2016-08-10 21:51:17 · 17807 阅读 · 3 评论 -
missForest一种非参数的缺失值填补方法
介绍对于处理现实中的数据时,我们常常会遇到缺失值,这里我们将介绍一种缺失值的填补方法missForest,这是利用随机森林来填补缺失值的非参数方法,他可以适用于任何类型的数据(连续、离散)。其他类似的缺失值填补方法还有MICE,在这里不做介绍。方法我们假设我们的数据是X=(X1,X2,...,Xp)X=(X_1,X_2,...,X_p)的n*p的一个矩阵。如果对于一个任意的变量XsX_s,我们想填充原创 2016-08-07 23:05:44 · 19065 阅读 · 8 评论 -
R语言做贝叶斯网络结构学习
实例分析pcalg包的安装贝叶斯网络结构学习iris数据集Adult数据集本文使用pcalg包做贝叶斯网络结构的学习实例分析pcalg包的安装安装pcalg包时由于有些依赖包已经被CRAN撤掉,所以安装起来有些技巧。 以下是安装代码:install.packages("pcalg")## 如果https://不行可以改成http://试试source("https://biocondu原创 2016-04-24 10:46:05 · 17848 阅读 · 0 评论 -
最优化求导常用公式技巧
介绍了最优化过程中,常用到的几个符号与结论 ,并给出了一个求导的例子运用这些公式。原创 2016-06-16 12:55:44 · 2770 阅读 · 0 评论 -
机器学习模型评价指标及R实现
1.ROC曲线考虑一个二分问题,即将实例分成正类(positive)或负类(negative)。对一个二分问题来说,会出现四种情况。如果一个实例是正类并且也被 预测成正类,即为真正类(True positive),如果实例是负类被预测成正类,称之为假正类(False positive)。相应地,如果实例是负类被预测成负类,称之为真负类(True negative),正类被预测成负类则为假负类(fal原创 2016-06-10 22:32:34 · 10731 阅读 · 0 评论 -
基于用户投票的排名算法:威尔逊区间
迄今为止,这个系列都在讨论,如何给出"某个时段"的排名,比如"过去24小时最热门的文章"。但是,很多场合需要的是"所有时段"的排名,比如"最受用户好评的产品"。这时,时间因素就不需要考虑了。这个系列的最后两篇,就研究不考虑时间因素的情况下,如何给出排名。一种常见的错误算法是: 得分 = 赞成票 - 反对票假定有两个项目,项目A是60张赞成票,40张转载 2016-04-30 22:35:32 · 3180 阅读 · 0 评论 -
ALS矩阵分解算法应用
转自:https://github.com/ceys/jdml.wiki.git 编写人:ceys/youyis 一、算法描述1.原理问题描述ALS的矩阵分解算法常应用于推荐系统中,将用户(user)对商品(item)的评分矩阵,分解为用户对商品隐含特征的偏好矩阵,和商品在隐含特征上的映射矩阵。与传统的矩阵分解SVD方法来分解矩阵R(R∈Rm×nR\in \mathbb{R}^{m\times转载 2016-04-06 20:47:49 · 8983 阅读 · 3 评论 -
机器学习之正则化(Regularization)
1. The Problem of Overfitting1还是来看预测房价的这个例子,我们先对该数据做线性回归,也就是左边第一张图。如果这么做,我们可以获得拟合数据的这样一条直线,但是,实际上这并不是一个很好的模型。我们看看这些数据,很明显,随着房子面积增大,住房价格的变化趋于稳定或者说越往右越平缓。因此线性回归并没有很好拟合训练数据。我们把此类情况称为欠拟合(under转载 2016-04-04 19:32:47 · 1034 阅读 · 0 评论 -
如何证明一个问题是NP-Hard或NP-Complete?
文章目录NP-hard vs NP-CompleteReductionSAT ProblemReducing SAT to Shortest Clique ProblemReducing SAT to Shortest Tour ProblemA List of NP-CompleteSet Vertex Cover Problem & Independent SetK-coloring ...原创 2018-12-23 14:53:05 · 18926 阅读 · 3 评论