- 博客(18)
- 资源 (19)
- 收藏
- 关注
原创 Python分析和实现基于用户和Item的协同过滤算法
打开微信扫一扫,关注《搜索与推荐Wiki》1:协同过滤算法简介2:协同过滤算法的核心3:协同过滤算法的应用方式4:基于用户的协同过滤算法实现5:基于物品的协同过滤算法实现一:协同过滤算法简介 关于协同过滤的...
2016-05-30 12:08:02 58281 54
原创 《hadoop进阶》PeopleRank从社交关系中挖掘价值用户
转载请注明出处: 转载自 Thinkgamer的CSDN博客: blog.csdn.net/gamer_gyt代码下载地址:点击查看1:PageRank 与 PeopleRank2:需求分析:挖掘CSDN博客的价值用户3:算法模型:PeopleRank算法4:架构设计:从数据准备到PR算法的MR化5:程序开发:hadoop实现PeopleRank算法
2016-05-29 22:42:53 14508 4
原创 《排序算法》——希尔排序,桶式排序(Java)
一:希尔排序也称缩小增量排序,是直接插入排序算法的一种更高效的改进版本。希尔排序是非稳定排序算法,先取一个小于n的整数d1作为第一个增量,把文件的全部记录分组。所有距离为d1的倍数的记录放在同一个组中。先在各组内进行直接插入排序;然后,取第二个增量d2<d1重复上述的分组和排序,直至所取的增量=1(<…该方法实质上是一种分组插入方法
2016-05-27 11:13:11 2464
原创 《hadoop进阶》web日志系统 KPI指标的分析与实现
推广一下个人的微信公众号【搜索与推荐Wiki】 转载请注明出处: 转载自 T...
2016-05-27 01:08:21 15045 5
原创 《矩阵》——稀疏矩阵(Java)
转载请注明出处: 转载自 Thinkgamer的CSDN博客:blog.csdn.net/gamer_gyt1:稀疏矩阵的背景2:什么是稀疏矩阵?3:为什么要对稀疏矩阵进行压缩存储以及压缩存储的方式?4:稀疏矩阵的相关运算一:背景 第一此介绍稀疏矩阵是在数据结构学习时,然后当时并没有多么用心的去学习它,因为,感觉它在实际应用中很少遇见,直
2016-05-26 13:07:44 8936 1
原创 《图论》——图的存储与遍历(Java)
一:图的分类1:无向图 即两个顶点之间没有明确的指向关系,只有一条边相连,例如,A顶点和B顶点之间可以表示为 也可以表示为,如下所示 2:有向图 顶点之间是有方向性的,例如A和B顶点之间,A指向了B,B也指向了A,两者是不同的,如果给边赋予权重,那么这种异同便更加显著了
2016-05-25 15:28:59 16386 3
原创 《树》——二叉树(Java)
完整代码下载地址: 点击下载1:二叉树的分类(1)空二叉树——如图(a);(2)只有一个根结点的二叉树——如图(b);(3)只有左子树——如图(c);(4)只有右子树——如图(d);(5)完全二叉树——如图(e)。2:二叉树的相关术语树的结点:包含一个数据元素及若干指向子树的分支;孩子结点:结点的子树的根称为该结点的孩
2016-05-22 20:29:34 2518
原创 《链表》——单向链表和双向链表(Java)
完整的代码地址为:github 点击查看单链表单链表包括数据域和指向下一个节点的指针域,其结构如上图所示首先定义一个数据类:class DATA{ //定义链表的一个节点 String key; //节点的关键字 String name; int age;}定义一个链表类(包括以下几种方法):1:在尾部添加节点
2016-05-20 20:03:36 3805
原创 《栈 队列》——栈与队列(Java)
一:对列队列是一种先进先出的数据结构实现代码:package Queue;/* * 使用java构建队列,并模拟实现队列的入队和出对方法 */public class Queue { //队列类 private int maxSize; //定义队列的长度 private int[] arrQueue; //队列 private int rear
2016-05-19 21:13:27 3279
原创 《排序算法》——归并排序,插入排序(Java)
一:归并排序算法步骤:1、申请空间,使其大小为两个已经排序序列之和,该空间用来存放合并后的序列2、设定两个指针,最初位置分别为两个已经排好序列的起始位置3、比较两个指针所指向的元素,选择相对小的元素到合并空间,并移动指针到下一位置4、重复步骤3直到某一指针达到序列结尾5、将另一序列下剩下的所有元素直接复制合并到序列结尾归并排序用到了分治策略。用分治策略解决问题分
2016-05-18 19:45:53 2616
原创 《机器学习实战》利用PCA来简化数据
===================================================================== 《机器学习实战》系列博客是博主阅读《机器学习实战》这本书的笔记也包含一些其他python实现的机器学习算法 github 源码同步:https://github.com/Thinkgamer/Machine-Learning-Wit
2016-05-15 19:08:18 6390 3
原创 《机器学习实战》预测数值型数据-回归(Regression)
回归的一般方法:(1)收集数据:采用任意方法收集数据(2)准备数据:回归需要数值型数据,标称型数据将被转化成二值型数据(3)分析数据:绘出数据的可视化二维图将有助于对数据做出理解和分析,在采用缩减法求得新回归系数之后,可以将新拟合线在图上作为对比(4)训练算法:求得回归系数(5)测试算法:使用R2或者预测值和数据的拟合度,来分析模型的效果(6)使用算法:使用回归,可以在给定输入的时候预测出一个数值,这是对分类方法的提升,因为这样可以预测连续性数据而不仅仅是离散的类别标签github
2016-05-14 18:33:14 14935 6
原创 《机器学习实战》AdaBoost算法的分析与实现
===================================================================== 《机器学习实战》系列博客是博主阅读《机器学习实战》这本书的笔记也包含一些其他python实现的机器学习算法 github 源码同步:https://github.com/Thinkgamer/Machine-Learning-With-Py
2016-05-11 10:41:52 10130 3
原创 非二元属性的关联规则挖掘和关联规则的评价
===================================================================== 《机器学习实战》系列博客是博主阅读《机器学习实战》这本书的笔记也包含一些其他python实现的机器学习算法 github 源码同步:https://github.com/Thinkgamer/Machine-Learning-With-
2016-05-10 19:39:11 4695
原创 《机器学习实战》使用Apriori算法和FP-growth算法进行关联分析(Python版)
1:关联分析2:Apriori算法和FP-growth算法原理3:使用Apriori算法发现频繁项集4:使用FP-growth高效发现频繁项集5:实例:从新闻站点点击流中挖掘新闻报道以下程序用到的源代码下载地址:GitHub一:关联分析1:相关概念关联分析(association analysis):从大规模数据集中寻找商品的隐含关系项集 (itemse
2016-05-09 19:29:27 30567 24
原创 关于Python编码问题的一些看法
近期在做一个图书推荐系统的项目,其中在登录模块涉及到了中文字符,这一直是个很烦人的问题,因为编码格式太多,且不同编码格式下相同的字符的长度也不一样,所以在字符编码,特别是中文编码这一块很让人头疼,但幸好这一次,解决了问题,下面我就简单的谈一谈我对他的理解在廖学峰的博客上他对编码做了一个简答的介绍,但主要是试验部分,我主要是结合我自己做的项目对其进行解读1:字符编码的来源和简单分类
2016-05-08 12:02:17 3644
原创 scikit-learn学习之SVM算法
======================================================================本系列博客主要参考 Scikit-Learn 官方网站上的每一个算法进行,并进行部分翻译,如有错误,请大家指正转载请注明出处,谢谢 ========================================================...
2016-05-04 21:12:10 61643 12
原创 eclipse编写MapReduce程序依赖的JAR包
吐槽一下: 小编之前编写MR程序都是把hadoop解压之后的所有文件全部BuildPath进去的,近期发现这样不行,不能长久做,如果要把程序打包成jar文件在终端运行的话,是不是会太..... 所以小编就一顿尝试下,先是尝试安装maven,可是发现在Ubuntu的eclipse整了好久也没OK,就放弃了如需转载:请注明出处,说实话过程很心酸.......网上现有版本
2016-05-03 14:04:03 6012 1
word2vec.zip
2019-11-13
NLP汉语自然语言处理原理与实战
2018-06-15
gephi-0.9.1-windows.exe
2017-02-14
mysql-connector-java-5.0.4-bin.jar
2017-02-14
commons-el-1.0.jar,jasper-compiler.jar,jasper-runtime.jar
2016-07-28
从疝气病症预测病马的死亡率的测试数据集
2016-04-25
十大算法之线性查找算法
2015-07-29
securboot未完全配置消除补丁
2014-08-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人