- 博客(7)
- 资源 (2)
- 问答 (1)
- 收藏
- 关注
转载 机器学习算法比较
机器学习算法比较Posted on 2016-02-26 | In ML | | views : 18253本文主要回顾下几个常用算法的适应场景及其优缺点!(提示:部分内容摘自网络)。机器学习算法太多了,分类、回归、聚类、推荐、图像识别领域等等,要想找到一个合适算法真的不容易,所以在实际应用中,我们一般都是采用启发式学习方式来实验。通常最开始
2017-08-29 15:05:51 385
转载 模板的声明和实现为何要放在头文件中?
http://www.gois.ws/showfile.asp?id=460:0:0如何组织编写模板程序 发表日期: 1/21/2003 12:28:58 PM 发表人: Nemanja Trifunovic前言常遇到询问使用模板到底是否容易的问题,我的回答是:“模板的使用是容易的,但组织编写却不容易”。看看我们几乎每天都能遇到的模板类吧,如STL, ATL, WT
2017-08-15 18:55:51 364
转载 彻底解决matplotlib中文乱码问题
1.环境查看a.系统版本查看[hadoop@p168 ~]$ cat /etc/redhat-releaseCentOS Linux release 7.2.1511 (Core) b.系统中文字体查看[hadoop@p168 ~]$ fc-list :lang=zh/usr/share/fonts/wqy-microhei/wqy-microhei.t
2017-08-14 17:38:56 947
原创 python 进程间通信
注意一点,进程间通信,尤其是使用manager的时候,性能会受限于manager进程,所以应该尽量减少写manager的情况和频率,比如每个进程应该优先把结果存在本地进程然后统一写manager等方式python multiprocessingmultiprocessing在2.6才开始使用multiprocessing 是一个使用方法类似threadi
2017-08-07 16:40:06 527
转载 多高的AUC才算高?
问题的引出 AUC这个指标有两种解释方法,一种是传统的“曲线下面积”解释,另一种是关于排序能力的解释。例如0.7的AUC,其含义可以大概理解为:给定一个正样本和一个负样本,在70%的情况下,模型对正样本的打分高于对负样本的打分。可以看出在这个解释下,我们关心的只有正负样本之间的分数高低,而具体的分值则无关紧要。 我们在各种分享中常常会看到,某大牛的某模型
2017-08-02 19:10:58 3267
转载 数据挖掘算法之离散化和二元化
离散化和二元化有些数据挖掘算法,特别是某些分类算法,要求数据是分类属性形式。发现关联模式的算法要求数据是二元属性形式。这样,常常需要将连续属性变换成分类属性(离散化,discretization),并且连续和离散属性可能都需要变换成一个或多个二元属性(二元化,binarization)。此外,如果一个分类属性具有大量不同值(类别),或者某些值出现不频繁,则对于某些数据挖掘任务,通过合并某些值减
2017-08-01 15:00:01 630
ML step by step
2017-09-21
python 正则表达式 findall和search的问题
2015-09-23
TA创建的收藏夹 TA关注的收藏夹
TA关注的人