机器学习
Adobee Chen
这个作者很懒,什么都没留下…
展开
-
Isolation Forest孤立森林(一)
孤立森林论文地址 http://cs.nju.edu.cn/zhouzh/zhouzh.files/publication/icdm08b.pdf概要 现有的基于模型的异常检测方法大多是构造一个正常实例的概要文件,然后将不符合标准的实例作为异常文件进行认证。本文提出了一种完全不同的基于模型的方法,该方法明确地分离了异常。实证评价表明,在AUC和处理时间方面,特别是在大数据集方面,经...原创 2018-12-26 16:12:44 · 2044 阅读 · 0 评论 -
BST(二叉搜索树)的Unsuccessful search
原文地址:https://book.huihoo.com/data-structures-and-algorithms-with-object-oriented-design-patterns-in-c++/html/page309.html#SECTION001133000不成功的搜索当找到搜索对象时,所有成功的搜索都会终止。因此,所有成功的搜索都在内部节点处终止。相反,所有不成功的搜索...翻译 2018-12-26 16:27:57 · 681 阅读 · 0 评论 -
Isolation Forest(二)之spark-iforest源码分析
github地址:https://github.com/titicaca/spark-iforest项目的目录结构如图,breastw.csv是乳腺癌分类数据全部数据地址:https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/breast-cancer-wisconsin.data...原创 2019-01-04 11:32:31 · 1702 阅读 · 6 评论 -
Isolation Forest孤立森林(二)之sklearn实现,源码分析
孤立森林算法sklearn实现,源码分析算法一: 首先初始化一些参数class sklearn.ensemble.IsolationForest(n_estimators=100, max_samples=’auto’, contamination=’legacy’, max_features=1.0, bootstrap=False, n_jobs=None, behaviour=’...原创 2019-01-02 11:21:20 · 10852 阅读 · 4 评论 -
数据不平衡的解决办法大全
数据不平衡问题在机器学习任重中经常遇到,就是大部分数据是一个类别,而少数数据是另一个类别。数据不平衡导致的问题: 举个例子 在一个二分类问题中,A:B=1:100,使用有监督学习的分类算法,最后结果忽略了A,将所有的训练样本都分类为B,这样模型的准确率也非常的高,但是如果更关注A的数据,也就是A的数据不能被误判时,就会出现问题。解决方案: 设置损失函数的权重 下采样/欠采样 Edi...原创 2019-01-07 14:46:53 · 893 阅读 · 0 评论 -
Match算法介绍(一)
定义:Match基于当前user(profile、history)和context,快速在全库里找到TopN最相关的item。通常做法: 用各种算法做召回,比如user/item/model-based CF Content-based,Demographic-based,DNN-Embedding-based等March策略,做粗排后交由后面的Rank层做更精细的排序,最终展现TopK...原创 2019-03-29 17:32:44 · 2421 阅读 · 0 评论 -
推荐系统介绍
推荐系统存在的前提: 信息过载,用户需求不明确推荐系统使用的场景:猜你喜欢,相似物品推荐等推荐系统的评估方法问卷调查、离线模型评估、在线评估A/B test实践:利息按评估和在线评估相结合,定期做问卷调查A/B test 单层实验: 将用户分流,根据uid取模,将用户进行分组,给每个实验组分配一定的流量。但是流量比较少,策略比较多,不利于迭代。而且实验之间是不独立的,策略...原创 2019-03-29 11:16:18 · 207 阅读 · 0 评论 -
隐马尔可夫模型
马尔科夫链马尔科夫性质(马尔科夫链)通俗来讲马尔科夫性质就是某一时刻的状态转移的概率只依赖于上一个状态,与之前的所有状态没有关系。马尔科夫链核心马尔科夫链的核心就是状态转移矩阵(条件概率转移矩阵) (盗个图)马尔科夫链细致平衡(收敛)条件=p:其中的和必须为1,状态转移矩阵是固定不变的,从任意状态能转变到任意状态,可能的状态数是有限的。马尔科夫链缺点在相同的状态转移矩...原创 2019-04-29 16:04:54 · 153 阅读 · 0 评论 -
病理分析之逻辑回归
原创 2019-07-04 17:35:42 · 285 阅读 · 0 评论