- 博客(7)
- 资源 (1)
- 收藏
- 关注
原创 极简机器学习范例——分类——逻辑回归
逻辑回归分类的优缺点及使用数据类型决策树就是事先设定一棵树,树的所有非叶子节点都是由特征构成的,然后根据这个树自定而下问问题,直到把测试记录归类到叶子节点(最终的分类结果)。例子:根据动物颜色、长度等特征判断动物智商高低(分类结果);根据一系列特征判断给患者配什么眼镜等。优点:数据形式非常容易理解;可以处理不相关特
2014-02-26 17:05:29 2973
原创 基于OpenStack的虚拟机在线迁移
基于OpenStack的虚拟机在线迁移方案及遇到问题转至元数据结尾这是我们云机团队做的方案,在线上运行了几个月了比较稳定,拿出来分享给大家。大致描述一下场景:系统采用了计算存储松耦合结构,虚机的映像文件在远端共享存储上,所以迁移起来速度很快。在我们系统中,最快一个用了6秒,即完成了在线迁移,这是真正的live migration,我们一边迁移,一边故意在
2014-02-25 12:12:14 13326 2
原创 Spark集群部署
Spark集群部署1. 安装环境简介 硬件环境:两台四核cpu、4G内存、500G硬盘的虚拟机。 软件环境:64为Ubuntu12.04 LTS;主机名分别为spark1、spark2,IP地址分别为172.18.18.239/240。JDK版本为1.7。集群上已经成功部署了Hadoop2.2,详细的部署过程可以参见另一篇文档Yarn的安装与部署2.
2014-02-14 14:50:56 15467 1
原创 极简机器学习范例——分类——朴素贝叶斯
朴素贝叶斯分类的优缺点及使用数据类型决策树就是事先设定一棵树,树的所有非叶子节点都是由特征构成的,然后根据这个树自定而下问问题,直到把测试记录归类到叶子节点(最终的分类结果)。例子:根据动物颜色、长度等特征判断动物智商高低(分类结果);根据一系列特征判断给患者配什么眼镜等。优点:数据形式非常容易理解;可以处理不相关
2014-02-12 20:44:47 3253
原创 Java中的Iterator
两种遍历方式:EntrySet 还是 KeySetKeySet遍历两次:1)先遍历HashMap对象一次,得到key的Iterator;2)再根据key遍历一次,找到VauleEntrySet遍历一次: 遍历HashMap对象,得到Entry;详见:http://kim-miao.iteye.com/blog/736143
2014-02-09 11:11:48 2692
原创 极简机器学习范例——分类——决策树
决策树分类的优缺点及使用数据类型优点:数据形式非常容易理解;可以处理不相关特征数据;计算复杂度不高;缺点:可能产生过渡匹配问题适用数据类型:数值型和标称型一、算法核心思想1)选取特征(特征即属性)2)计算待分类数据与样本数据(已分好类的数据)的距离。一般是多维特征,需对每个特征进
2014-02-03 22:05:59 2632
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人