![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Data Mining
清风思月
测开工程师
展开
-
机器学习(二):贝叶斯
贝叶斯一、引言南京大学周志华在《机器学习》中介绍:贝叶斯决策论在机器学习、模式识别等诸多关注数据分析的领域都有极为重要的地位。根据在属性间依赖的涉及程度,贝叶斯分类器形成了一个“谱”:朴素贝叶斯分类器不考虑属性间的依赖性,贝叶斯网络能表示任意属性间的依赖性,二者分别位于“谱”的两端。介于两者之间的则是一系列半朴素贝叶斯分类器,它们基于各种假设和约束来对属性间的部分依赖性进行建模。贝叶斯分类器与一般意义上的“贝叶斯学习”有显著区别,前者是根据最大后验概率进行单点估计,后者则是进行分布估计。原创 2020-06-28 18:22:00 · 1815 阅读 · 1 评论 -
KDD2019经典论文奖-CELF算法实现
数据挖掘KDD领域-CELF已成为一种经典的社会网络影响最大化发现算法,用于改进贪心算法的效率(提升700%)。获得KDD 2019的经典论文奖,作者:Jure Leskovec,论文:Cost-effective Outbreak Detection in Networks(2007)。CELF算法是基于影响力具有子模性特征提出的,即所有节点的影响力随着种子节点集合中节点数目增加在减弱,具...原创 2020-03-16 15:55:13 · 2419 阅读 · 1 评论 -
python 多项式特征生成PolynomialFeatures 欠拟合与过拟合
在做线性回归预测时候,为了提高模型的泛化能力,经常采用多次线性函数建立模型f = k*x + b 一次函数f = a*x^2 + b*x + w 二次函数f = a*x^3 + b*x^2 + c*x + w 三次函数等等泛化: 对未训练过的数据样本进行预测。 欠拟合: 由于对训练样本的拟合程度不够,导致模型的泛化能力不足。过拟合: ...转载 2019-04-25 10:27:25 · 1548 阅读 · 0 评论