- 博客(5)
- 资源 (2)
- 收藏
- 关注
原创 推荐系统总结
介绍推荐系统是一种信息过滤系统,用于预测用户对物品的“评分”或“偏好”。常用的算法如下: 1. 规则模型 (Apriori算法) 2. 协同过滤 (User-based / Item-based)规则模型(Apriori算法)找出所有频繁项集,频繁性大于等于最小支持度根据频繁项集产生强关联规则,并满足最小支持度和最小置信度支持度 (X=&
2018-07-11 23:33:13 6019
原创 FastText算法调研
介绍词向量表示和每个n-gram相关联;单词用这些向量的和表示。这个方法很快,能够在大的语料库计算词语呈现,并且允许没有在训练库中出现的词语。大多数现有的方法用一个唯一的向量表示,且参数不共享,忽略了词语内部的结构,这对那些多种形态的语言有很大限制。 因为许多单词形式如下规则,可以改进矢量表示对于形态丰富的语言,使用字符级别信息. 这篇文章用n-gram的单词学习词语呈现,并且用这些向...
2018-07-29 19:16:34 1470 2
原创 SVM学习总结
介绍在机器学习中,支持向量机(英语:support vector machine,常简称为SVM,又名支持向量网络[1])是在分类与回归分析中分析数据的监督式学习模型与相关的学习算法。给定一组训练实例,每个训练实例被标记为属于两个类别中的一个或另一个,SVM训练算法创建一个将新的实例分配给两个类别之一的模型,使其成为非概率二元线性分类器。SVM模型是将实例表示为空间中的点,这样映射就使得单独类...
2018-07-17 01:11:06 1698
原创 常见集成模型总结
简介Bagging, Boosting 和 StackingBagging(Bootstrap汇总)是一种集成方法。首先,我们创建随机训练数据集样本(训练数据集的子集)。然后我们为每个样本建立分类器。最后,这些多分类器的结果将结合起来,使用平均或多数投票。Bagging有助于降低方差。 Boosting提供了预测模块的连续学习功能。第一个预测模块从整个数据集上学习,下一个预测模块在前...
2018-07-16 22:56:08 10486 1
原创 天池大数据比赛-天体分类总结
赛题介绍比赛链接: https://tianchi.aliyun.com/competition/introduction.htm?spm=5176.100150.711.8.5f712784mldsqp&raceId=231646在天文学中,光谱描述了天体的辐射特性,以不同波长处辐射强度的分布来表示。每条观测得到的光谱主要是由黑体辐射产生的连续谱、天体中元素的原子能级跃迁产生的...
2018-07-15 23:02:40 8849
javafx2.0官方例子
2013-05-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人