自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 linux学习

基础知识linux 是同时给多用户使用的操作系统,多用于作为服务器,没有太多应用。不像windows操作系统。/home 目录下有多个文件,代表多个用户。最好只在/home目录下操作,不弄其他文件。linux常用命令SSH客户端远程操作,管理和维护远程登入,所以需要终端命令。...

2021-08-30 10:26:36 93

原创 数分

最近再看《精益数据分析》,记录总结下书中的精华。目录我们都在说慌我们都在说慌

2020-09-25 20:18:52 269

原创 关于xgboost的一些理解

xgboost将梯度提升树方法带到了一个极致,在很多比赛上都是首选的算法,本文总结一下自己对xgboost的一些理解。关于xgboost在算法上的优化这里就不再介绍,网上有很多好的文章,百度一下就可以找到。精确贪心算法在单机版本下xgboost支持精确贪心算法,树学习方法最重要的点就是选择最优的分割点,精确贪心算法就是将每个特征按特征值预排序,然后枚举所有特征上所有可能的分割,计算增益,然后选择增益最大的值作为分割点,由于这里需要遍历每个特征值,因此计算开销在数据量很大时非常大。也是建树过程中最耗时的地

2020-09-14 23:47:11 1042

原创 关于随机森林的一些理解

目录随机森林简介优缺点优点缺点sklearn中随机森林参数简单实现随机森林简介随机森林是一种只关注决策树的集成学习方法,由Leo Breiman和 Adele Cutler提出,它将bagging和随机选择特征结合起来,在树的集成产生之后,对分类问题使用投票的方法来产生预测结果,对回归问题使用算数平均的方法来生成结果。优缺点优点由于弱学习器之间没有关联,可以并行进行训练,训练速度快由于随机选择特征,可以避免大数据中的维度灾难由于bagging和随机选择特征模型泛化能力强训练后,可以给出特征

2020-09-13 13:16:43 826

原创 Windows下fasttext文本分类

在写论文的时候了解到有fasttext这种文本分类方法,也看了很多别人的博客,但感觉使用这种方法的人并不是很多,或者使用的版本有些旧。本文会介绍下Windows下最新的fasttext版本以及如何进行文本分类文章目录fasttext简介Windows下安装版本新版特色主要函数及用法以下是本篇文章正文内容,下面案例可供参考fasttext简介 fasttext是2016年facebook开源的一款高效词表示和文本分类工具。它是一个浅层的神经网络模型,类似于word2vec的CBOW,主要用途就是.

2020-09-12 17:33:30 1230 5

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除