Jipon

Nothing or Best!!~

排序:
默认
按更新时间
按访问量

RocketMQ的安装使用以及踩过的坑

  好久没写博客了,由于最近刚工作需要用到RocketMQ,所以自己也简单搭建了一下RocketMQ,本文为最简单的搭建方法,只有一个namesrv和一个broker,本文只提供搭建方法、demo和踩过的坑,并不解释RocketMQ的原理等,至于原理,请同学们自己度娘或者点本文下面的连接。1.所需...

2018-02-12 17:49:43

阅读数:1268

评论数:3

使用Java随机划分数据集为训练集和测试集

在做机器学习,推荐系统等等实验的过程中,我们难免会自己来手动划分数据集,一般都是用一些python开源库来划分,今天我们使用Java自己写代码来随机划分数据集。下面为代码: import java.io.BufferedReader; import java.io.BufferedWriter; ...

2017-08-30 12:06:13

阅读数:1336

评论数:2

利用SVD矩阵分解进行k次交叉实验和Top—N推荐

如果上一节没看的,请先看上一节Surprise项目的使用。本文利用开源GitHub项目Surprise。   上一节说到具体的安装和一些方法的属性,本节将以SVD为例具体的代码demo的实现。   先说下如何利用Surprise加载本地数据集进行k次交叉实验,如果看下API,其实非常简单,体现了S...

2017-08-08 16:41:41

阅读数:923

评论数:4

GitHub开源推荐系统项目Surprise的安装和使用

最近在GitHub上发现了一个很好的开源推荐系统,Star700多,包含了常用的矩阵分解算法,包括SVD,SVD++,NMF等等,GitHub地址:https://github.com/NicolasHug/Surprise,由于安装和使用过程中有许多坑,特此记录下来:   Surprise安装 ...

2017-08-08 14:34:46

阅读数:6788

评论数:0

Python计算地图上两个点的距离

""" Created on Thu Jun 1 14:41:06 2017 @author: Jipon """ from math import * # input Lat_A 纬度A # input Lng_A 经度A # ...

2017-06-01 14:53:11

阅读数:1030

评论数:0

倒排索引的java实现

假设有3篇文章,file1, file2, file3,文件内容如下:    文件内容代码   file1 (单词1,单词2,单词3,单词4....)      file2 (单词a,单词b,单词c,单词d....)      file3 (单词1,单词a,单词3,单词d....)  ...

2017-05-02 19:28:49

阅读数:3458

评论数:0

简单实现根据Td-idf实现语句相似度

假设两个语句已经分好词,计算两个向量的余弦相似度 public class Similar { public static String string; public static String str; public static double d; public static ...

2017-04-28 15:25:43

阅读数:554

评论数:0

找出一组数中相同的数据并取出计算出长度

最近在写一些东西的时候突然遇到以下问题: 比如,一组数{1,1,2,3,4,5,5,3},怎么从这组数中取出相同的数并且保证取出的数当做此数组的key,例如上述数组经过取之后变成{1,{1,1}},{2,{2}},{3,{3,3},{4,{4}},{5,{5,5}},并且计算出每组数组的长度 下面...

2017-04-26 20:05:09

阅读数:307

评论数:0

网易招聘编程笔试题

1.如果一个数字序列逆置之后跟原序列是一样的就称这样的数字序列为回文序列。例如: {1, 2, 1}, {15, 78, 78, 15} , {112} 是回文序列,  {1, 2, 2}, {15, 78, 87, 51} ,{112, 2, 11} 不是回文序列。 现在给出一个数字序列,...

2017-03-30 11:48:10

阅读数:397

评论数:0

Java内部类总结

内部类不是很好理解,但说白了其实也就是一个类中还包含着另外一个类 如同一个人是由大脑、肢体、器官等身体结果组成,而内部类相当于其中的某个器官之一,例如心脏:它也有自己的属性和行为(血液、跳动) 显然,此处不能单方面用属性或者方法表示一个心脏,而需要一个类 而心脏又在人体当中,正如...

2017-03-21 19:41:44

阅读数:126

评论数:0

插入排序以及和冒泡排序的区别

一、    插入排序 插入排序:每次从输入数据中移除一个元素并将其插入已排序序列的正确位置,直到所有输入元素都插入有序序列中。插入排序适用于数据几乎都已经排序或者输入数据规模较小时可以使用插入排序。 什么意思呢?举个例子: 例如:给定一个序列:6 8    1    4    5    3    ...

2017-03-09 14:30:04

阅读数:367

评论数:0

Java笔试题-1

1 有如下一段代码,请选择其运行结果() public class StringDemo{ private static final String MESSAGE="taobao"; public static void main(String [] args) { ...

2017-03-08 11:02:57

阅读数:145

评论数:0

《统计学习方法》笔记-第一章

第一章  统计学习方法概论、 图片未能正常显示,请在文件末尾下载PDF文件   1.监督学习、非监督学习 监督学习:学习一个模型,使模型能够对任意的输入,都能给相应的输出做出很好的预测。如分类和回归。事先是有训练数据的 非监督学习:    而无监督学习是事先没有训练数据的,直接对数据进行...

2017-03-01 19:23:50

阅读数:164

评论数:0

Logistic回归

1、逻辑回归 本着学习的原则,搜集了各方面的资料来进行一下逻辑回归的总结。首先说下什么是逻辑回归,逻辑回归和线性回归一样,都是回归中常见的算法。那么什么是回归呢,它和分类有什么区别呢?逻辑回归是分类还是回归呢?首先说下什么是回归,比如有在二维平面上一系列的点,例如(x1,y1),(x2,y2).....

2017-02-22 19:08:06

阅读数:245

评论数:0

决策树的剪枝和CART算法

一、简介 分类与回归树CART (Ciassification and Regression Trees)是分类数据挖掘算法的一种。CART是在给定输入随机变量X条件下输出随机变量Y的条件分布概率。该模型使用了二叉树将预测空间递归划分为若干子集,Y在这些子集的分布是连续均匀的。树中的叶节点对应着...

2017-02-21 20:08:17

阅读数:248

评论数:0

K近邻-kd树

k近邻算法 给定一个训练数据集,对新的输入实例,在训练数据集中找到跟它最近的k个实例,根据这k个实例的类判断它自己的类(一般采用多数表决的方法)。 k近邻模型 模型有3个要素——距离度量方法、k值的选择和分类决策规则。 模型 当3要素确定的时候,对任何实例(训练或输入),它所属的...

2017-01-12 20:16:54

阅读数:475

评论数:2

感知机模型

一、什么是感知机 感知机1957年由Rosenblatt提出,是神经网络与支持向量机的基础。感知机是二类分类的线性分类模型,其输入实例为实例的特征向量,输出为实例的类别,取+1和-1二值。 二 感知机模型 定义 假设输入空间是,输出空间是,x和y分属这两个空间,那么由输入空间到输出空间的...

2017-01-10 17:47:17

阅读数:363

评论数:0

EM算法的理解以及应用

本文是《统计学方法》第九章自己的笔记,为了更方便的理解,本文对转载的文章内容稍作修改。EM算法的每次迭代由两部分组成:E步,求期望;M步,求极大。所以这一算法称之为期望极大算法,简称EM算法。 EM算法的引入 介绍一个使用EM算法的例子: 三硬币模型 有ABC三枚硬币,...

2017-01-08 15:10:51

阅读数:2849

评论数:0

numpy中的矩阵和数组运算

Preface 在相关聚类算法的实现过程中,用python语言实现,会经常出现array和matrix的混淆,这里做个总结。 array数组 numpy中最基本(默认)的类型是array,他的相关操作都是按元素操作的即用作数值计算当中(按元素操作有+,-,,/,*等)。相乘举例: ...

2017-01-04 15:40:16

阅读数:308

评论数:0

欠拟合与过拟合概念

欠拟合与过拟合概念 本次课程大纲: 1、  局部加权回归:线性回归的变化版本 2、  概率解释:另一种可能的对于线性回归的解释 3、  Logistic回归:基于2的一个分类算法 4、  感知器算法:对于3的延伸,简要讲   复习:  –第i个训练样...

2016-12-30 20:27:10

阅读数:753

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭