自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 泛统计理论初探——主成分分析方法简介

统计学习-主成分分析方法介绍探究主成分分析今天我们来聊聊这个主成分分析方法,主成分分析方法是一种将统计问题中的自变量进行组合,组合成新的变量后,按照使用者需求,提取出最主要的变量的一种方法。主成分分析方法是一种比较常见的统计学方法,常用于降维、特征工程等场景,在一些竞赛中使用主成分分析方法对海量的特征进行提取,合成新的维度,这样可以提高模型的可解释性,也可以提升模型的稳健性。当然,主成分分析...

2019-12-28 21:04:02 1275

原创 泛统计理论初探——初探特征工程

统计学习-特征工程介绍探究特征工程众所周知,特征工程是非常重要的数据挖掘步骤之一。在我们获取数据后,会首先进行数据清洗并得到一个能够分析的数据集。然后开始观察数据,并对数据做特征工程处理,因为有些模型对数据的特征属性要求较高。因此特征工程处理技巧是一个非常重要的步骤,它甚至可以影响最终数据挖掘的结果。在本文中,将会介绍几种简单的特征工程方法,比如对数压缩、特征归一化等方法。首先我们对特征也就...

2019-12-22 11:46:37 768

原创 LeetCode刷题——最长共同前缀

最长共同前缀题目的思路探讨与源码该题的题目如下图,核心是通过寻找字符串列表里的所有字符串的最长共同前缀。本人在看到该题目后,认为问题的核心是寻找寻找最短的字符串,同时在这个基础上去将最短的字符串进行分解,逐个字符地和其他字符串去进行比较,最终得到和每个字符串的一个共同字符数的值,取一个最小值n,然后在最短字符串取前n个字符即可。#喷火龙与水箭龟test1=["flower","flow"...

2019-12-12 23:20:40 429

原创 LeetCode刷题——罗马数

罗马数题目的思路探讨与源码罗马数的题目如下图,核心是将输入的罗马数字符串进行转化,得到一个十进制的数字。本人在看到该题目后,认为罗马数的转化本质上只需要注意相邻两个字符串的大小即可,所以本人建立了一个与输入字符串等长的方向列表,该列表中的值+1代表当前的字符对应的数值大于等于右边的值,当列表中的值为-1代表当前的字符对应的数值小于右边的值。由此得到一个值为+1或者-1的列表。#喷火龙与水...

2019-12-07 23:45:31 399

原创 泛统计理论初探——Kmeans方法简介

数据挖掘-探讨Kmeans算法Kmeans算法简介众所周知,机器学习分为有监督学习和无监督学习两种。对于有监督学习的情况,一般根据被解释变量是否连续,分为分类问题和回归问题,在之前的文章中已经有过讨论。在本文中,我们将讨论无监督学习中的一种聚类方法,即Kmeans算法。该算法被称为K均值方法,从字面上的意思就可以看出,确定参数K非常重要。实际上,K均值方法的主要思想是采用距离作为衡量两个实体之...

2019-12-06 22:50:26 2199

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除