自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (1)
  • 收藏
  • 关注

原创 机器学习笔记-K近邻

k近邻法不具有显示的学习过程,是一种懒惰学习 即可分类,又可回归 模型由三个基本要素——距离度量、k值的选择、分类决策规则决定 kd树是二叉树,表示对k维空间的一个划分。是一种便于对k维空间中的数据进行快速检索的数据结构 构造kd树 搜索kd树 http://blog.csdn.net/app_12062011/article/details/51986805 构造kd树,相...

2018-09-26 23:22:50 623

原创 机器学习笔记-感知机

感知机的解不唯一,与初始值和选取的误分类点有关 感知机学习算法包括原始形式和对偶形式 对偶形式是对算法执行速度的优化,引入了Gram矩阵,达到一次计算,多次使用的效果 损失函数为误分类点到超平面距离之和(凸函数) 参数通过随机梯度下降法来确定(每次使用一个误分类点)对线性可分数据集,感知机算法收敛,即经过有限次迭代可以得到一个将训练数据集完全正确划分的分离超平面及感知机模型 当训练集线...

2018-09-14 15:52:35 757

原创 Oracle计算分组分位数

 我们在进行分析过程中,经常会有计算某个特征的分位数这个需求。下面为大家介绍如何在oracle计算某一列数据的分位数。需要求分位数的表结构如下:select * from test_lizhen; 我们发现该表有两列,一列是代表不同产品,一列是代表每个用户的属性。我们可以通过如下方法计算特征的分位数1)不分产品,计算全体用户的分位数select PERCENTI...

2018-09-11 09:54:26 12005

原创 机器学习中的信息量与熵

 我们在学习机器学习算法的时候经常听到自信息、互信息、条件熵、交叉熵等概念。下面为我在学习过程中总结的信息量和熵的相关概念。信息量:度量的是一个具体事件发生所带来的信息熵:在结果出来之前对可能产生的信息量的期望——考虑该随机变量的所有可能取值,即所有可能发生事件所带来的信息量的期望目录目录信息量的相关概念有:自信息、互信息自信息:I(X)互信息:I(X;Y)熵:...

2018-09-07 16:41:54 2320

原创 利用Python将数据库提取的数据转为DataFrame格式

     在利用python进行数据分析时,有时候我们会直接连接数据库,将需要分析的数据导入到python中。如果直接导入到python中,数据格式为tuple,不便于后续的分析。下面为大家介绍两种方法,能够将利用sql提取的数据转换为dataframe。解析法def get_df_from_db(sql): cursor = connection.cursor() cur...

2018-09-04 17:43:17 24899 2

XGBoost原理解析.pdf

XGBoost是机器学习比较热门且重要的算法,其原理为机器学习从业者必须了解的知识。现将电子版免费分享给大家。

2020-05-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除