大数据
水墨小龙虾
2012-----北京蓝汛
2014-----M1905
2014-----猎豹移动
展开
-
hadoop简要教程
hadoop简要教程概述 hadoop是apache软件基金会旗下的一个开源分布式计算平台。 大数据的特点4v,volume(量大)、variety(种类多)、value(价值密度低)、velocity(处理速度快) 云计算因大数据而存在,hadoop连接了大数据和云计算。 国内外hadoop的应用现状 yahoo 总节点超过42000,单master节点有4500个节点。总集群量350pb fa原创 2015-09-06 22:31:34 · 863 阅读 · 0 评论 -
机器学习简要教程1
开发机器学习应用程序的步骤 收集数据 准备输入数据(格式化、归一化) 分析输入数据 训练算法 测试算法 使用算法 k近邻算法优点:精度高、对异常值不敏感、无数据输入假定 缺点:计算复杂度高、空间复杂度高 使用数据范围:数值型和标称型from numpy import * import operatordef create_data_set(): group = array([[1.0,1原创 2015-12-27 20:53:10 · 670 阅读 · 0 评论