![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 81
三室两厅
兴趣方向:社交网络分析,数据挖掘,大数据分析
展开
-
线性判别分析
1. 问题 之前我们讨论的PCA、ICA也好,对样本数据来言,可以是没有类别标签y的。回想我们做回归时,如果特征太多,那么会产生不相关特征引入、过度拟合等问题。我们可以使用PCA来降维,但PCA没有将类别标签考虑进去,属于无监督的。 比如回到上次提出的文档中含有“learn”和“study”的问题,使用PCA后,也许可以将这两个特征合并为一个,降了维度。但假设我们的转载 2014-07-03 15:33:57 · 865 阅读 · 0 评论 -
《Who is Tweeting on Twitter: Human, Bot, or Cyborg》重点翻译
摘要: 1)大规模测量:微博行为,微博内容,账号属性 2)构建分类系统:有四部分组成 一个基于熵的组件; 一个基于机器学习的组件; 一个账户属性组件; 一个决策器。 关键字:自动识别,机器,半机器,twitter 1、引言 论文目的:特征化微博用户自动化特征,并且将用户分为三类(人,机器,半机器) 分类器组成: 一个基于熵的组件:用微博发布间隔作翻译 2014-07-04 22:32:39 · 813 阅读 · 0 评论 -
Logistic regression概述
Logistic regression (逻辑回归)是当前业界比较常用的机器学习方法,用于估计某种事物的可能性。比如某用户购买某商品的可能性,某病人患有某种疾病的可能性,以及某广告被用户点击的可能性等。(注意这里是:“可能性”,而非数学上的“概率”,logisitc回归的结果并非数学定义中的概率值,不可以直接当做概率值来用。该结果往往用于和其他特征值加权求和,而非直接相乘) 那么它究竟是什么转载 2014-06-19 10:43:52 · 470 阅读 · 0 评论