自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

呵呵

哈哈

  • 博客(21)
  • 资源 (15)
  • 收藏
  • 关注

转载 机器学习 - 模型性能改善

机器学习最有价值(实际应用最广)的部分是预测性建模。也就是在历史数据上进行训练,在新数据上做出预测。 而预测性建模的首要问题是:如何才能得到更好的结果?这个备忘单基于本人多年的实践,以及我对顶级机器学习专家和大赛优胜者的研究。有了这份指南,你不但不会再掉进坑里,而且会提升性能,甚至在你自己的一些预测难题中取得世界领先水平的结果。让我们一起来看看吧!

2017-06-30 23:20:40 1135

转载 Python类型判断type与isinstance

在游戏项目中,我们会在每个接口验证客户端传过来的参数类型,如果验证不通过,返回给客户端“参数错误”错误码。这样做不但便于调试,而且增加健壮性。因为客户端是可以作弊的,不要轻易相信客户端传过来的参数。def compute_entropy(self, dataset): """ 计算数据集dataset的信息熵 dataset: 第一列为数据集的label """

2017-06-30 19:01:03 11913

原创 找出一个列表中出现次数最多的元素

在实现knn算法中遇到的问题,如何从一个列表中找出出现次数最多元素,方法是:字典 + 字典get方法统计次数 + 字典排序找出最大。num_list = np.random.randint(0,10,100, np.int) num_dict = {} # 统计每个元素出现的次数 for i in range(len(number)): num

2017-06-30 01:13:19 9956

原创 numpy - 对整个数组元素直接进行操作

1. numpy可以对整个数组元素直接进行操作。# 计算一个一维数组和二维数组的距离distance = np.sum((test_x[i, :] - train_x)**2, axis=1)

2017-06-29 23:30:54 2536

原创 Java编程思想查漏补缺(二)

之前学C++多一点,现在转做数据行业,因此开始学习Python和Java。阅读Java编程思想第五版时,发现自己在Java方面的一些不足,记录,共享之。本人基本是利用碎片时间,以及晚上睡不着的时候用手机在WPS上看的PDF版本,若有错误之处,还望指出,有错必改。看到第六章,有不少东西和C++不太一样了。2016-06-271. static1.1 静态方法通常, 在一个

2017-06-28 01:33:55 710

原创 Java对象与对象的引用

“每种编程语言都有自己的数据处理方式。有些时候,程序员必须注意将要处理的数据是什么类型。你是直接操纵元素,还是用某种基于特殊语法的间接表示(例如C/C++里的指针)来操作对象。所有这些在 Java 里都得到了简化,一切都被视为对象。因此,我们可采用一种统一的语法。尽管将一切都“看作”对象,但操纵的标识符实际是指向一个对象的“引用”(reference)。”  这段话来自于《Java编程思想》,

2017-06-27 11:06:59 499

原创 leetcode - 1

import java.util.Arrays;import java.util.HashMap;/** * @author: UniqueZ_ * @file: the first question of leetcode - two sum * @date: 2017-06-22 */public class TwoSum { private int[] arr; pr

2017-06-25 21:15:48 16561

原创 最优化 - 牛顿优化算法

本人总结的常用优化算法:主要包括梯度下降,共轭梯度法;牛顿法,拟牛顿法;信赖域方法,罚函数法。# -*- coding: utf-8 -*-"""author: UniqueZ_file: 牛顿法, 基于DFP的拟牛顿法date: 2017-06-24remark: 原方程为(x1)**2 + 2*(x2)**2"""import numpy as npim

2017-06-25 16:16:53 1706

原创 最优化 - 梯度优化算法

本人总结的常用优化算法:主要包括梯度下降,共轭梯度法;牛顿法,拟牛顿法;信赖域方法,罚函数法。# -*- coding: utf-8 -*-"""author: UniqueZ_file: gradient descent algorithm, CG methoddate: 2017-06-23remark: 原方程为(x1)**2 + 2*(x2)**2"""imp

2017-06-25 16:04:35 2860

原创 Java编程思想查漏补缺(一)

阅读Java编程思想第五版时,发现自己在Java方面的一些不足,记录,共享之。

2017-06-25 01:22:32 465

原创 Java创建对象

Java创建对象至少有五种方式,这里本着实用主义介绍两种。1. newclassName ObjectName = new className();People Tom = new People();2. clone()对类进行克隆,相当于Python里面的copy()函数,生成的是一个新的对象John = Tom.clone()public class S

2017-06-23 00:42:17 513

转载 阿里巴巴ODPS/MaxComputer

(一)基本概念1.ODPS:Open Data Processing Service, 简称ODPS;是由阿里云自主研发,提供针对TB/PB级数据、实时性要求不高的分布式处理能力,应用于数据分析、挖掘、商业智能等领域;阿里巴巴的离线数据业务都运行在ODPS上; 2.御膳房:基于ODPS的一个应用模型;基于公共云计算的数据管理、计算和交换平台,为政府机构、企业、科研机构、第三方软件服务商

2017-06-22 19:01:28 5181

原创 Java格式化输入输出

1. println()println()常常配合toString()函数使用,直接输出整个数组的时候,需要配合使用Arrays类Arrays.toString(arrayName)2. format()格式化输出,非常像C中的printfimport java.util.Arrays;/** * @author zkj * @file Java格式化输

2017-06-22 12:57:56 4203

原创 Java HashMap

HashMap是java下的一个类1. HashMap的创建和使用HashMap varName = new HashMaptype只能是基本数据类型的封装类:boolean Booleanchar Characterbyte Byteshort Shortint Integerlong Longfloat Floatdouble DoubleS

2017-06-22 12:36:38 441

原创 Java数组

1. 数组的创建1.1 typeName[] arrayName = new typeName[arraySize];// 下面两种其实进行了静态初始化1.2 typeName[] arrayName = new typeName[] { elements };1.3 typeName[] arrayName = { elements };2. 数组遍历for

2017-06-22 00:43:52 406

转载 最优化 - 拟牛顿法DFP算法

一、牛顿法    在博文“优化算法——牛顿法(Newton Method)”中介绍了牛顿法的思路,牛顿法具有二阶收敛性,相比较最速下降法,收敛的速度更快。在牛顿法中使用到了函数的二阶导数的信息,对于函数,其中表示向量。在牛顿法的求解过程中,首先是将函数在处展开,展开式为:其中,,表示的是目标函数在的梯度,是一个向量。,表示的是目标函数在处的Hesse矩阵

2017-06-20 13:30:53 3323

原创 无参装饰器与有参装饰器

一、无参装饰器函数Python的 decorator (装饰器) 本质上就是一个高阶函数,它接收一个函数作为参数,然后,返回一个新函数。使用 decorator 用python提供的 @ 语法,这样可以避免手动编写 f = decorate(f) 这样的代码。例1:[html] view plain copy print?

2017-06-19 13:20:48 857

原创 详解Python装饰器

一、引出装饰器概念引入问题:  定义了一个函数,想在运行时动态的增加功能,又不想改动函数本身的代码?示例:希望对下列函数调用增加log功能,打印出函数调用:[html] view plain copy print?def f1(x):     return x*2  def f2(x):     return x*x

2017-06-19 01:01:06 517

原创 numpy数组切片

numpy切片:1. 数组切片2. 列表下标存取办法3. 以数组为下标存取数组4. 多维数组切片存取# 1. 数组切片if False: arr = np.arange(0,10) print(arr[2]) print(arr[3:5]) print(arr[:5]) print(arr[-1]) print(ar

2017-06-15 20:19:59 6120

转载 TF-IDF与余弦相似性的应用(二):找出相似文章

今天,我们再来研究另一个相关的问题。有些时候,除了找到关键词,我们还希望找到与原文章相似的其他文章。比如,"Google新闻"在主新闻下方,还提供多条相似的新闻。为了找出相似的文章,需要用到"余弦相似性"(cosine similiarity)。下面,我举一个例子来说明,什么是"余弦相似性"。为了简单起见,我们先从句子着手。  句子A:我喜欢看电视,不喜欢看

2017-06-11 10:57:56 383

转载 数据挖掘 - TF-IDF(-)

这个标题看上去好像很复杂,其实我要谈的是一个很简单的问题。有一篇很长的文章,我要用计算机提取它的关键词(Automatic Keyphrase extraction),完全不加以人工干预,请问怎样才能正确做到?这个问题涉及到数据挖掘、文本处理、信息检索等很多计算机前沿领域,但是出乎意料的是,有一个非常简单的经典算法,可以给出令人相当满意的结果。它简单到都不需要高等数学,普通

2017-06-11 10:56:01 643

DBSCAN算法实现

DBSCAN算法实现

2017-08-14

聚类算法数据集

对聚类算法进行测试的数据

2017-08-14

svd计算例子

SVD分解计算方式

2017-08-10

PCA详细推导

PCA,主成分分析,详细推导。

2017-08-10

GMM高斯混合模型

高斯混合模型

2017-08-04

线性回归合集

线性回归,局部加权线性回归,ridge,lasso

2017-07-26

logistic回归推导

logistic回归,不再一头雾水

2017-07-14

图像处理功能集成

图像处理功能集成,集成了一些基本功能。

2016-12-23

PRML.pdf文档

PRML,机器学习Bible

2016-10-06

数字图像处理冈萨雷斯

数字图像处理冈萨雷斯matlab版

2016-10-06

学习OpenCV中文版

学习OpenCV中文版

2016-10-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除