2017年08月_LegenDavid

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月 02月 01月

转载机器学习算法比较

机器学习算法比较Posted on 2016-02-26 | In ML | | views : 18253本文主要回顾下几个常用算法的适应场景及其优缺点！（提示：部分内容摘自网络）。机器学习算法太多了，分类、回归、聚类、推荐、图像识别领域等等，要想找到一个合适算法真的不容易，所以在实际应用中，我们一般都是采用启发式学习方式来实验。通常最开始

2017-08-29 15:05:51 385

原创一步一步解决一个机器学习问题

2017-08-25 17:09:42 361

转载模板的声明和实现为何要放在头文件中？

http://www.gois.ws/showfile.asp?id=460:0:0如何组织编写模板程序发表日期： 1/21/2003 12:28:58 PM 发表人： Nemanja Trifunovic前言常遇到询问使用模板到底是否容易的问题，我的回答是：“模板的使用是容易的，但组织编写却不容易”。看看我们几乎每天都能遇到的模板类吧，如STL, ATL, WT

2017-08-15 18:55:51 364

转载彻底解决matplotlib中文乱码问题

1.环境查看a.系统版本查看[hadoop@p168 ~]$ cat /etc/redhat-releaseCentOS Linux release 7.2.1511 (Core) b.系统中文字体查看[hadoop@p168 ~]$ fc-list :lang=zh/usr/share/fonts/wqy-microhei/wqy-microhei.t

2017-08-14 17:38:56 947

原创 python 进程间通信

注意一点，进程间通信，尤其是使用manager的时候，性能会受限于manager进程，所以应该尽量减少写manager的情况和频率，比如每个进程应该优先把结果存在本地进程然后统一写manager等方式python multiprocessingmultiprocessing在2.6才开始使用multiprocessing 是一个使用方法类似threadi

2017-08-07 16:40:06 527

转载多高的AUC才算高？

问题的引出 AUC这个指标有两种解释方法，一种是传统的“曲线下面积”解释，另一种是关于排序能力的解释。例如0.7的AUC，其含义可以大概理解为：给定一个正样本和一个负样本，在70%的情况下，模型对正样本的打分高于对负样本的打分。可以看出在这个解释下，我们关心的只有正负样本之间的分数高低，而具体的分值则无关紧要。我们在各种分享中常常会看到，某大牛的某模型

2017-08-02 19:10:58 3267

转载数据挖掘算法之离散化和二元化

离散化和二元化有些数据挖掘算法，特别是某些分类算法，要求数据是分类属性形式。发现关联模式的算法要求数据是二元属性形式。这样，常常需要将连续属性变换成分类属性（离散化，discretization），并且连续和离散属性可能都需要变换成一个或多个二元属性（二元化，binarization）。此外，如果一个分类属性具有大量不同值（类别），或者某些值出现不频繁，则对于某些数据挖掘任务，通过合并某些值减

2017-08-01 15:00:01 630

ML step by step

ML step by step ML step by step ML step by step ML step by step ML step by step ML step by step ML step by step ML step by step ML step by step

2017-09-21

在线最优化求解(Online Optimization)-冯扬-2014.12.0

2017-04-06

python 正则表达式 findall和search的问题

2015-09-23

TA创建的收藏夹 TA关注的收藏夹

TA关注的人