- 博客(19)
- 收藏
- 关注
原创 k近邻学习
概念k邻近学习是第一种常用的监督学习方法,其工作机制如下:给定测试样本,基于某种距离度量找出训练集中与最靠近的k个训练样本,然后基于这k个“邻居”的信息来进行预测。
2017-12-05 10:59:31 413
原创 Mahout实战之相似性度量
相似度计算之前我们提到过基于用户的推荐程序包括两个重要的部分:UserNeighborhood和UserSimilarity。可见相似度时推荐算法中重要的一环,如果对用户之间的相似性缺乏可靠并有效的定义,这类推荐方法是没有意义的。无论是“基于物品”还是“基于用户”,推荐算法都十分依赖于相似度的计算。接下来将阐述Mahout中所用到的相似度计算标准。
2017-12-05 10:58:34 502
原创 Mahout实战之基本概念
Mahout简介Apache Mahout是一个来自Apache的开源的机器学习软件库。它所实现的算法归属于机器学习。Mahout是可扩展的,旨在当所处理的数据规模远大于单机处理能力时称为一种可选的机器学习工具。Mahout当前仅关注机器学习的三个主要领域,推荐、聚类和分类。
2017-12-05 10:58:08 596
原创 JSON传递数据
JSON字符串json指的是javascript对象表示方法,全称为Javascript Object Notation,是独立于语言的轻量级文本数据交换格式,传递速率较快于xml,是现阶段作为数据传递的主要格式。
2017-12-05 10:57:32 4149
原创 JAVA数据结构——堆
堆是一颗具有特殊属性的二叉树,它具有以下两个特点:堆事一棵完全二叉树;堆的每个结点都大于或等于它的任意一个孩子。堆作为一棵二叉树,除了最后一层可以无需填满,插入元素都是按照偏左放置的。与二叉查找树不同,堆一般是通过数组线性表来实现。
2017-04-28 14:48:40 844
原创 JAVA数据结构——线性表
线性表是典型的数据结构之一,Java API支持多种数据结构,利用集合框架进行具体实现。本文将剖析这些数据结构是如何实现的。
2017-04-20 19:34:58 647
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人