- 博客(13)
- 资源 (8)
- 收藏
- 关注
转载 逻辑回归、决策树和支持向量机(II)
转载:http://www.csdn.net/article/2015-12-02/2826374?reload=1摘要:本文讨论了如何在逻辑回归、决策树和SVM之间做出最佳选择。结论:首先应该选择逻辑回归,然后试试决策树(随机森林)是否可以大幅度提升模型性能;特征的数量和观测样本特别多、资源和时间充足时,可使用SVM。本文是该系列的第二篇,第一篇参见: 逻辑回归 Vs 决
2017-05-27 11:03:43 2528
转载 逻辑回归、决策树和支持向量机(I)
转载:http://www.csdn.net/article/2015-11-26/2826332摘要:分类问题是商业业务中遇到的主要问题之一。本文对三种主要技术展开讨论,逻辑回归(Logistic Regression)、决策树(Decision Trees)和支持向量机(Support Vector Machine,SVM)。分类问题是我们在各个行业的商业业务中遇到的主要问题之一。在本
2017-05-27 10:43:59 785
转载 用 WEKA 进行数据挖掘,第 3 部分: 最近邻和服务器端库
转载:https://www.ibm.com/developerworks/cn/opensource/os-weka3/index.html简介在这个 “用 WEKA 进行数据挖掘” 系列之前的两篇文章中,我介绍了数据挖掘的概念。如果您还未曾阅读过用 WEKA 进行数据挖掘,第 1 部分:简介和回归 和 用 WEKA 进行数据挖掘,第 2 部分:分类和群集,那么请先阅
2017-05-24 17:57:18 471
转载 用 WEKA 进行数据挖掘,第 2 部分: 分类和群集
转载:https://www.ibm.com/developerworks/cn/opensource/os-weka2/简介在 用 WEKA 进行数据挖掘,第 1 部分:简介和回归,我介绍了数据挖掘的概念以及免费的开源软件 Waikato Environment for Knowledge Analysis(WEKA),利用它可以挖掘数据来获得趋势和模式。我还谈到了第一种数据
2017-05-24 17:56:10 587 1
转载 用 WEKA 进行数据挖掘,第 1 部分: 简介和回归
转载:https://www.ibm.com/developerworks/cn/opensource/os-weka1/index.html简介什么是 数据挖掘?您会不时地问自己这个问题,因为这个主题越来越得到技术界的关注。您可能听说过像 Google 和 Yahoo! 这样的公司都在生成有关其所有用户的数十亿的数据点,您不禁疑惑,“它们要所有这些信息干什么?”您可能还会惊奇地发
2017-05-24 15:29:56 1227 2
转载 WEKA3.8 导入 libsvm 和 liblinear 包
转载:http://blog.csdn.net/smilehehe110/article/details/53898266WEKA 3.8(应该版本3.6以上就不可以用上述方法集成libsvm了)导入libsvm,需要从WEKA GUI Chooser首页,tools菜单下的Package Manager里边下载,操作如图所示。
2017-05-24 11:49:08 2020 3
转载 WEKA 使用教程
转载:http://blog.csdn.net/yangliuy/article/details/7589306WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),它的源代码可通过http://www.cs.waikato.ac.nz/ml/weka得到。同时weka也是新西兰的一种鸟名,而WEKA的主要开发者来自新西兰。
2017-05-23 13:54:33 1510 1
转载 聪明的老板才不招工资低的程序员
转载:http://blog.csdn.net/mindfloating/article/details/72083705前阵子写了一篇《如果两个程序员差不多,选写作能力更好的那个》,就有读者留言说:“老板,不都是选工资更低的那个么?”。其实,这是另一个维度上的看法,正好最近也和一些经常招程序员的负责人们聊起过这个话题,顺着这个思路,不知不觉就想了很多。人头值几何早年刚毕业
2017-05-18 12:48:51 774
转载 开发人员的必备技能
转自:葡萄城控件对于刚开始学习软件开发的新人来说,“必备技能”往往意味着一个长长的、标有重要度的学习列表,但是过长的列表通常会导致新人不知如何开始学习,压力倍增。本文尝试列举出最重要的几个技能,也期望通过此列表能给新人一个比较明确的学习重点和路径。深入学习一门编程语言没有掌握任何一门编程语言,就不可能成为一名编程人员。许多程序员试图在学习之初一次学习
2017-05-15 13:50:52 524
转载 程序学徒与导师
转载:http://blog.csdn.net/mindfloating/article/details/71076570上个月,一个叫我“师傅”的同事离职了。这个叫法源自五年前他刚毕业进入公司时,我被安排成为了他的“导师(mentor)”。但没多久,组织结构发生变化他调去了另一个部门,做另外的项目。后来,这些年下来我们的接触反而很少了,实际的“导师”关系就结束了,但这个称
2017-05-09 09:43:18 552
转载 hive 如何去掉重复数据,显示第一条
name adx tran_id cost tsck 5 125.168.10.0 33.00 1407234660ck 5 187.18.99.00 33.32 1407234661ck 5
2017-05-08 17:33:34 15405
原创 Mysql 统计百分比
SELECT f_language, a.cnt, CONCAT(ROUND(a.cnt / b.cntSum * 100, 2),'','%')FROM ( SELECT f_language, count(*) AS cnt FROM t_video WHERE f_create_time >= '2017-05-06' GROUP BY
2017-05-08 15:24:16 22006 1
转载 Hive 取非 Group by 字段数据的方法
遇到这么一个需求,输入数据为一个ID对应多个name,要求输出数据为ID是唯一的,name随便取一个就可以。执行以下Hive ql语句:123456SELECT sid, class_id FROM table2 GROUP BY sid ;会报错:
2017-05-08 14:21:58 2958
MyEclipse2015 Stable2.0补丁
2016-09-09
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人