机器学习
文章平均质量分 95
vickyleexy
生命在于折腾 github博客:vickyleexy.com 未完成,会越来越好滴~
展开
-
炼数成金优惠码
炼数成金优惠码vickyleexy分享了炼数成金邀请码,使用邀请码报名课程可以减免50%固定学费哦! http://www.dataguru.cn/invite.php?invitecode=H456 优惠码为: H456原创 2017-02-08 21:19:28 · 879 阅读 · 0 评论 -
决策树(补充)
算法核心问题该按什么样的次序来选择变量(属性)?最佳分离点(连续的情形)在哪儿?ID3信息增益计算 C4.5信息增益的方法倾向于首先选择因子数较多的变量信息增益的改进:增益率 CART分类树算法大部分流行机器学习软件的决策树都是使用CART实现的可以支持分类和回归在分类树算法中使用基尼指数选择变量 韩家炜 p221预剪枝和后剪枝 看《Python 大战机器学习》原创 2017-06-19 10:58:20 · 287 阅读 · 0 评论 -
决策树02——决策树的构建
《 machine learning in action》之决策树计算给定数据集的香农熵创建文件trees.py# -*- coding=utf-8 -*-#计算给定数据集的熵from math import logdef calcShannonEnt(dataSet): numEntries = len(dataSet) labelCounts = {} #实例总数原创 2017-06-06 02:07:02 · 662 阅读 · 1 评论 -
具体剪枝算法
C4.5的剪枝《Python大战机器学习》 第36页基本思路:计算每个节点的“经验熵”递归地从树的叶节点向上回退,如果回退使“损失函数”值下降,则剪枝,把父节点变成新的叶节点递归进行上一步 损失函数: T表示决策树; α表示先验参数,惩罚系数。α越大,树越简单; C表示代价函数; Tf T_f 表示叶节点的个数; NtN_t 表示在决策树的第t个叶结点中,样本的总数量; N原创 2017-06-22 23:12:38 · 1232 阅读 · 0 评论 -
彻底解决matplotlib中文乱码问题
当我们用matplotlib作图时,往往会发现中文的文字变成了小方块,我在绘制决策树的时候就碰到了这个问题。将各种方式试了个遍,都不管用……最终发现是没有删除matplotlib下字体的缓存目录,即~/.cache/matplotlib 下面记录找到的比较好的方法,以便下次使用。1.环境查看a.系统版本查看vickyleexy@vickyleexy-pc:~$ cat /etc/lsb-releas转载 2017-06-08 16:27:03 · 9422 阅读 · 1 评论 -
决策树01——决策树的原理
此笔记根据《machine learning in action》和周志华教授的《机器学习》所作。决策树的构造优点:计算复杂度不高,输出结果易于理解,对中间值的确实不敏感,可以处理不相关特征数据。缺点:可能会产生过度匹配问题。适用数据类型:数值型和标称型《machine learning in action》:If so return 类标签;Else 寻找划分数据集的最好特征原创 2017-05-31 23:27:34 · 964 阅读 · 1 评论 -
Python机器学习(03)
课程大纲:第一课时:介绍机器学习 第二、三课时:贝叶斯分析 第四、五课时:树模型,决策树、回归树、提升树、随机森林、深度森林、xgboost、剪枝算法(预习:统计学习要素、统计学习方法) 第六课时:特征工程专题,怎样在海量特征中选取最合适的特征。 第七、八课时:半监督学习 第九、十课时:凸优化 第十一课时:凸优化或流形学习贝叶斯建模方法:Cameron书第33页,承接上节课关于接受短信原创 2017-05-18 23:19:17 · 861 阅读 · 0 评论 -
使用决策树预测隐形眼镜类型
步骤收集数据:提供的文本文件。准备数据:解析tab键分隔的数据行。分析数据:快速检查数据,确保正确的解析数据内容,使用createPlot()函数绘制最终的树形图。训练算法:使用上节的createTree()函数测试算法:编写测试函数验证决策树可以正确分类给定的数据实例。使用算法:存储树的数据结构,以便下次使用时无需重新构造树。#-×-coding=utf-8 -×-import tr原创 2017-06-16 17:26:28 · 1471 阅读 · 0 评论 -
决策树03——使用matplotlib绘制树形图并测试算法
在决策树02——决策树的构建中,我们将已经进行分类的数据存储在字典中,然而字典的表示形式非常不直观,也不容易理解,所以我们将字典中的信息绘制成树形图。Matplotlib注解功能 Matplotlib提供一个注解工具annotations,它可以在数据图形上添加文本注释。 以下将使用Matplotlib的注解功能绘制树形图,它可以对文字着色,并提供多种形状以供选择,而且我们还可以反转箭头,将它指原创 2017-06-06 22:56:57 · 3088 阅读 · 0 评论 -
python机器学习(02)
ps:没有01python机器学习课程模块贝叶斯分析从决策树到随机森林,gcForest凸优化半监督学习特征工程参考书:https://github.com/CamDavidsonPilon/Probabilistic-Programming-and-Bayesian-Methods-for-Hackers 使用到的扩展包:PyMCPyMC安装比较困难,基于Anaconda部署比原创 2017-04-21 23:12:40 · 626 阅读 · 0 评论 -
机器学习实战—k近邻算法(kNN)03-手写识别系统
使用k-近邻算法的手写识别系统 这里构造的系统只能识别数字0~9。 需要识别的数字已经使用图形处理软件,处理成具有相同的色彩和大小:宽高是32像素×32像素的黑白图像。示例:使用k-近邻算法的手写识别系统步骤(1)收集数据:提供文本文件。 (2)准备数据:编写函数classify0(),将图像格式转换为分类器使用的list格式。 (3)分析数据:在Python命令提示符中检查数据,确保它原创 2017-05-08 23:14:16 · 1944 阅读 · 0 评论 -
贝叶斯公式的共轭分布
共轭分布是一种极大简化贝叶斯分析的方法。其作用是,在贝叶斯公式包含多种概率分布的情况下,使这些分布的未知参数在试验前被赋予的物理意义,延续到试验后,便于分析。1. 贝叶斯公式贝叶斯公式如下:其中,表示模型中的未知参数,表示样本。这里有三个重要的概念:先验分布、似然函数,以及后验分布。是先验分布,表示在观察样本之前,按照经验认为符合某种概率分布。比如说在抛硬币之前,我们认为正反两面出现的概率各转载 2017-05-07 21:47:31 · 1191 阅读 · 0 评论 -
机器学习实战——k近邻算法(kNN)01
有监督的学习算法。简而言之,k-近邻算法采用测量不同特征之间的距离方法进行分类。工作原理: 存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)的分类标签。 一般来说,我们只选择样本数据集中前k个最相似的数原创 2017-05-02 01:52:06 · 844 阅读 · 0 评论 -
机器学习实战—k近邻算法(kNN)02-改进约会网站的配对效果
示例:使用k-近邻算法改进约会网站的配对效果在约会网站上使用k-近邻算法: 1.收集数据:提供文本文件。 2.准备数据:使用Python解析文本文件。 3.分析数据:使用matplotlib画二维扩散图。 4.训练算法:此步骤不适用于k-近邻算法 5.测试数据:使用提供的部分数据作为测试样本。 测试样本与非测试样本的区别在于,测试样本是已经完成分类的数据,若果预测分类与实际不同,则标记为原创 2017-05-07 20:29:59 · 3865 阅读 · 2 评论 -
没GPU也能玩梵高作画:Ubuntu tensorflow CPU版
转载于: http://blog.csdn.net/v_july_v/article/details/52683959 没GPU也能玩梵高作画:Ubuntu tensorflow CPU版作者:七月在线开发/市场团队骁哲、李伟、July时间:二零一六年九月二十七日交流:TensorFlow实战交流Q群 472899334,有问题可以加此群共同交流。另探究实验背后原理,请参看:11转载 2017-03-14 20:03:57 · 366 阅读 · 0 评论 -
人工智能不仅玩坏了一只猫,还玩坏了整个简笔画
转载于:http://556186.kuaizhan.com/67/7/p41080506935b23人工智能不仅玩坏了一只猫,还玩坏了整个简笔画 “火箭君真的是觉得,人工智能领域的应用型论文正在一天比一天有意思……管它会给世界的未来带来什么翻天覆地的变化,总之最近会给我们带来各种奇怪的好玩的莫名的笑点……今天火箭君介绍的是Christopher Hesse参照一篇图像翻译转载 2017-03-14 20:15:27 · 2161 阅读 · 0 评论 -
Python机器学习(01)
xgboost框架文章推荐: http://www.leiphone.com/news/201609/gox8CoyqMrXMi4L4.html 达特茅斯会议与人工智能的缘起: http://tech.163.com/16/0313/12/BI1P1CLI00094P0U.html书推荐: 维纳《控制论》 《七周七语言》 《人工智能:一种现代方法》(第三版) mark: ht原创 2017-03-13 22:08:11 · 439 阅读 · 0 评论 -
tensorflow
参考资料: http://blog.csdn.net/lingerlanlan/article/details/61616906原创 2017-03-13 22:16:01 · 289 阅读 · 0 评论 -
一篇非常棒的MCMC文章
MCMC(一)蒙特卡罗方法: http://www.cnblogs.com/pinard/p/6625739.html MCMC(二)马尔科夫链: http://www.cnblogs.com/pinard/p/6632399.html MCMC(三)MCMC采样和M-H采样: http://www.cnblogs.com/pinard/p/6638955.html MCMC(四)Gi...转载 2018-05-15 15:34:31 · 666 阅读 · 0 评论