小太阳~

风轻云淡

PageRank原理、举例、实现及使用networkX库简单调用

PageRank是google搜素算法用到的算法思想。关于PageRank的背景网上有很多,这里不再介绍,下面本文将从以下方面介绍PageRank: PageRank原理 PageRank举例 PageRank实现 使用networkX调用pagerank算法 一、PageRank原理 P...

2018-07-27 13:04:57

阅读数:368

评论数:0

StanfordCoreNLP: 英文句子词性还原、词干标注工具包简单使用(Java)

一、说明 StanfordCoreNLP是Stanford开发的关于自然语言处理的工具包,其包括分词、词性还原以及词性标注等很多功能。具体可参考官网:https://stanfordnlp.github.io/CoreNLP/。 这里主要是将其词性还原功能的简单使用。 二、下载和使用 1、下...

2018-04-17 14:53:52

阅读数:398

评论数:0

极大似然估计详解

原文链接:极大似然估计详解 极大似然估计         以前多次接触过极大似然估计,但一直都不太明白到底什么原理,最近在看贝叶斯分类,对极大似然估计有了新的认识,总结如下: 贝叶斯决策         首先来看贝叶斯分类,我们都知道经典的贝叶斯公式: ...

2018-01-17 11:07:35

阅读数:192

评论数:1

Bootstrap抽样和Monte Carlo思想

写在前面 总是搞不懂、记不住这些名字好像很厉害的算法思想,这篇文章主要写一下Bootstrap抽样和蒙特卡罗算法思想。 一、Bootstrap抽样 1、基本思想 Bootstrap抽样的基本思想是在全部样本未知的情况下,借助部分样本的有放回多次抽样,构建某个估计的置信区间,抽象地说...

2018-01-17 10:28:51

阅读数:1499

评论数:0

Bootstrap抽样:0.632自助法

Bootstrap方法:每当选中一个元组,这个元组同样也可能再次被选中并再次添加到训练集中。例如,想象一台从训练集中随机选择元组的机器,在有放回的的抽样中,允许机器多次选择同一个元组。 有多种自助方法,最常用的是 .632自助法。方法如下:​假设给定的数据集包含d个元组,该数据集有放回的抽样...

2018-01-15 21:05:57

阅读数:1700

评论数:0

用户画像设计示例

更新 -- 20180905 用户画像指通过挖掘用户信息来更好的描述用户的特征,是将数据标签化的过程。 对用户画像的设计主要包括两大类信息:①可直接获取信息或者通过简单聚合操作得到的特征;②挖掘类特征。挖掘类特征指可以根据用户的直接行为信息挖掘出用户的潜在兴趣爱好等。 下面是一个实例简单说明...

2017-04-23 09:15:48

阅读数:977

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭