自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 特征选择,熵,条件熵,信息增益

特征选择,熵,条件熵,信息增益特征选择例子熵条件熵信息增益例子特征选择特征选择是在于选取能够提高分类器学习效率的特征。对于没有分类能力的特征,经验上扔掉这样的特征对最终的分类结果并没有什么大影响。通常特征选择的准则是信息增益或信息增益比例子上表是有15个样本组成的贷款申请训练数据,数据包含贷款申请人的4个特征(年龄,是否有工作, 是否有自己的房子,信贷情况),最后一列是类别。特征选择是决定用哪个特征来划分特征空间,选择哪个特征作为根节点,可能的情况:直观上,如果一个特征具有更好的分类能力,或

2020-07-27 20:36:59 1400

原创 XGBoost论文阅读

1. Main Work1.1Tree Boosting with Loss function假设给定一个数据集DDD中有nnn个样本,每个样本有mmm维特征,通过训练数据集DDD,我们得到kkk棵树。这kkk棵树累加的值就是我们的预测值。yi^=∑k=1kfk(xi)fk∈F\widehat{y_i}=\sum_{k=1}^kf_k(x_i)\qquad f_k\in\mathcal{F}...

2020-04-22 18:24:06 186

原创 From Word Embeddings To Document Distances论文总结

前言最近阅读的论文FromWord Embeddings To Document Distances.做一个小总结。作为一个NLP刚刚开始,而且还没有入门的小白,很多的概念都不懂,一点点的查吧,边查边做笔记【苦笑脸】。例如word embedding,word2vec,bag-of-words,本文将详细解释相关的概念并加入我自己对文章的了解。基本概念word embedding:翻译过来...

2020-03-15 21:31:15 341

原创 手撸python 实现KNN分类算法

1、基于sklearn库实验KNN算法from sklearn import datasetsfrom sklearn.model_selection import train_test_splitfrom sklearn.neighbors import KNeighborsClassifierimport numpy as npiris = datasets.load_iris()...

2019-12-24 16:51:23 213

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除