- 博客(1)
- 资源 (16)
- 收藏
- 关注
翻译 Mesos框架简介
翻译自Open source datacenter computing with Apache Mesos 框架: Mesos由一个master进程和framework组成,master进程管理运行在集群节点上的slave daemon,framework是在这些slave节点上运行任务的计算框架(注:可以看作是Hadoop、Spark、Storm、MPI等计算框架)。master通过对计
2015-12-25 19:11:30 1291
机器学习实践指南:案例应用解析 (大数据技术丛书)_含目录_可复制
《机器学习实践指南:案例应用解析》是机器学习及数据分析领域不可多得的一本著作,也是为数不多的既有大量实践应用案例又包含算法理论剖析的著作,作者针对机器学习算法既抽象复杂又涉及多门数学学科的特点,力求理论联系实际,始终以算法应用为主线,由浅入深以全新的角度诠释机器学习。
全书分为准备篇、基础篇、统计分析实战篇和机器学习实战篇。准备篇介绍了机器学习的发展及应用前景以及常用科学计算平台,主要包括统计分析语言r、机器学习模块mlpy和neurolab、科学计算平台numpy、图像识别软件包opencv、网页分析beautifulsoup等软件的安装与配置。基础篇先对数学基础及其在机器学习领域的应用进行讲述,同时推荐配套学习的数学书籍,然后运用实例说明计算平台的使用,以python和r为实现语言,重点讲解了图像算法、信息隐藏、最小二乘法拟合、因子频率分析、欧氏距离等,告诉读者如何使用计算平台完成工程应用。最后,通过大量统计分析和机器学习案例提供实践指南,首先讲解回归分析、区间分布、数据图形化、分布趋势、正态分布、分布拟合等数据分析基础,然后讲解神经网络、统计算法、欧氏距离、余弦相似度、线性与非线性回归、数据拟合、线性滤波、图像识别、人脸辨识、网页分类等机器学习算法。此书可供算法工程师、it专业人员以及机器学习爱好者参考使用。
2017-08-24
IBM数据生成器(Seq)
IBM数据生成器,seq类型,适合用于关联分析生成事务数据库,方便快捷;其中类似T40I10D100K的数据就是通过IBM数据生成器生成的。
使用方法:bin/seq_data_generator seq [options]
2017-03-27
数据挖掘十大算法
《世界著名计算机教材精选:数据挖掘十大算法》详细介绍了在实际中用途最广、影响最大的十种数据挖掘算法,这十种算法是数据挖掘领域的顶级专家进行投票筛选的,覆盖了分类、聚类、统计学习、关联分析和链接分析等重要的数据挖掘研究和发展主题。《世界著名计算机教材精选:数据挖掘十大算法》对每一种算法都进行了多个角度的深入剖析,包括算法历史、算法过程、算法特性、软件实现、前沿发展等,此外,在每章最后还给出了丰富的习题和精挑细选的参考文献,对于读者掌握算法基本知识和进一步研究都非常有价值,对数据挖掘、机器学习和人工智能等学科的课程的设计有指导意义。
2016-06-02
《深入理解大数据》一书的源代码
《深入理解大数据》一书的源代码,里面包含许多经典例子的代码,java实现,易读性强,包含MapReduce的K-Means聚类算法、KNN最近邻分类算法、朴素贝叶斯分类算法、决策树分类算法等,还有基于MapReduce的搜索引擎算法、大规模基因序列化比对算法、重复文档检测算法等
2016-01-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人