[置顶] Mahout学习系列之推荐算法

参考:从源代码剖析Mahout推荐引擎    前言:Mahout框架集成了大量的常用的机器学习算法,且都支持在Hadoop分布式环境下运行,很大程度上节约了数据处理的时间成本,其中的推荐算法引擎有cf.taste包实现,它提供了一套完整的推荐算法工具库,同时规范了数据结构,并标准了程序开发过程。 1:Mahout推荐算法介绍 2:单机内存算法实现 3:基于hadoop分布式...
阅读(4285) 评论(0)

08.Django自定义模板,自定义标签和自定义过滤器

一:自定义模板 二:自定义标签 三:自定义过滤器...
阅读(4184) 评论(0)

07.Django中的自定义认证方式和权限的设计与使用

django 自定义认证方式和权限的设计应用...
阅读(3322) 评论(0)

Java 封装 HDFS API 操作

Java实现对HDFS API 的封装实现了常用的操作 判断某个文件夹是否存在 isExist(folder); 创建文件夹 mkdir(folder); 删除文件夹 rmr(folder); 列出所有文件夹 ls(folder); 递归列出所有文件夹 lsr(fol...
阅读(1878) 评论(0)

2015-03-22 网易笔试(数据挖掘方向)——邮件事业部

2015-3-22网易邮件事业部笔试题...
阅读(2289) 评论(0)

MapReduce设计模式学习

一:简介         概要设计模式更接近简单的MR应用,因为基于键将数据分组是MR范型的核心功能,所有的键将被分组汇入reducer中 本章涉及的概要模式有数值概要(numerical summarization),倒排索引(inverted index),计数器计数(counting with counter) 二:概要设计模式包含 2.1关于combiner和paritione...
阅读(2267) 评论(0)

Hadoop1.X 与 Hadoop2.X比较

鉴于好久没有更新博客,且最近开始找工作,所以对以往的相关知识进行整理 一:Haddop版本介绍 0.20.x版本最后演化成了现在的1.0.x版本 0.23.x版本最后演化成了现在的2.x版本 hadoop 1.0 指的是1.x(0.20.x),0.21,0.22 hadoop 2.0 指的是2.x,0.23.x CDH3,CDH4分别对应了hadoop1.0 h...
阅读(1694) 评论(0)
    Thinkgamer微博
    微信公众号【码农故事多】
    个人资料
    • 访问:873268次
    • 积分:10380
    • 等级:
    • 排名:第1802名
    • 原创:218篇
    • 转载:22篇
    • 译文:2篇
    • 评论:294条
    个人简介
    姓名:Thinkgamer

    Github:https://github.com/thinkgamer

    主攻:云计算/python/数据分析

    程度:熟悉/熟悉/熟悉

    微信:gyt13342445911

    Email:thinkgamer@163.com

    工作状态:在职ing

    心灵鸡汤:只要努力,你就是下一个大牛...

    hadoop/spark/机器学习群:279807394(大神建的群,蹭个管理员)

    欢迎骚扰........
    博客专栏
    最新评论