自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 收藏
  • 关注

原创 特征工程

123456

2020-12-04 18:00:32 68

原创 多路召回

1234

2020-11-30 22:12:51 91

原创 数据分析

1234567

2020-11-27 21:19:10 69

原创 赛题理解与提交结果

123345678

2020-11-25 19:47:15 170

原创 条件循环结构

12345

2020-07-23 21:33:57 66

原创 数据分析与清洗

123

2020-07-22 22:07:48 127

原创 Task01:变量、运算符、数据类型及位运算

12345

2020-07-22 21:47:32 56

原创 nlp文本分类

12345

2020-07-21 21:39:27 68

原创 Task4 建模调参

12345678

2020-04-01 22:25:46 79

原创 特征工程目标

12345678

2020-03-28 20:14:43 189

原创 EDA数据探索性分析

1234567

2020-03-24 21:25:33 102

原创 GAN

123456

2020-02-25 20:13:19 84

原创 图像分类

1234567

2020-02-25 20:06:16 73

原创 批量归一化和残差网络

12345678

2020-02-25 20:00:50 72

原创 卷积神经网络基础

1234

2020-02-19 20:35:16 76

原创 机器翻译及相关技术

12345678

2020-02-19 20:18:42 148

原创 过拟合、欠拟合及其解决方案;梯度消失、梯度爆炸;循环神经网络进阶

12345678

2020-02-19 20:13:39 79

原创 Softmax与分类模型

12345678

2020-02-14 19:22:57 69

原创 线性回归

12

2020-02-14 19:16:04 57

原创 TASK4

以lightGBM为例

2020-01-16 06:06:47 64

原创 TASK3

1.1 特征合并1.2 计算统计特征1.3 groupby方法生成统计特征1.4 聚类方法1.5 log平滑2.1 相关系数法2.2 Wrapper2.3 Embedded2.4 基于树模型的特征选择法

2020-01-12 21:50:42 169

原创 TASK2

1 缺失值处理2 异常值处理3 深度清洗

2020-01-09 23:41:30 50

原创 TASK2

利用动态数组解决数据存放问题删除指定节点旋转链表

2020-01-08 21:35:40 51

原创 数据竞赛task1

1载入数据并展示2缺失值分析3特征分布4Label分布

2020-01-07 20:51:20 88

原创 test1

1、编写一段代码,要求输入一个整数N,用动态数组A来存放2~N之间所有5或7的倍数,输出该数组2、托普利茨矩阵问题如果一个矩阵的每一方向由左上到右下的对角线上具有相同元素,那么这个矩阵是托普利茨矩阵。给定一个M x N的矩阵,当且仅当它是托普利茨矩阵时返回True。3、 三数之和给定一个包含 n 个整数的数组nums,判断nums中是否存在三个元素a,b,c,使得a + b + c ...

2020-01-06 22:08:47 175

原创 LightGBM

1、LightGBMhttps://www.cnblogs.com/jiangxinyang/p/9337094.html2、LightGBM的起源https://www.jianshu.com/p/3daf08229d783、Histogram VS pre-sortedHistogram先做binning然后寻找最优划分点4、leaf-wise VS level-wiseleve...

2019-08-15 16:22:55 142

原创 XGBoost算法梳理

1、算法原理一种提升树模型,将许多树(CART树)模型集成在一起,形成一个很强的分类器2、损失函数http://www.sohu.com/a/287700387_999508073、分裂结点算法1暴力枚举:遍历所有特征的所有可能的分割点,计算Gain值,选取最大(Feature, label)去分裂2近似方法:对于每个特征,只考察分位点,减少计算复杂度4、正则化https://bl...

2019-08-12 20:42:27 250

原创 决策树模型

1、信息论基础https://blog.csdn.net/MY578719543/article/details/881236672、决策树的不同分类算法(ID3算法、C4.5、CART分类树)的原理及应用场景https://blog.csdn.net/MY578719543/article/details/881236673、回归树原理3、决策树防止过拟合手段...

2019-08-12 12:35:30 63

原创 GBDTTASK2

1、前向分布算法Adaboost算法还有另一种解释,即:可以认为Adaboost算法是“模型为加法模型、损失函数为指数函数、学习算法为前向分布算法”时的二类分类学习方法https://blog.csdn.net/yc1203968305/article/details/781714642、负梯度拟合https://blog.csdn.net/akirameiao/article/deta...

2019-08-09 20:27:46 159

原创 TASK2

1、逻辑回归与线性回归的联系与区别分类与回归:回归模型就是预测一个连续变量(如降水量,价格等)。在分类问题中,预测属于某类的概率,可以看成回归问题。这可以说是使用回归算法的分类方法输出:直接使用线性回归的输出作为概率是有问题的,因为其值有可能小于0或者大于1,这是不符合实际情况的,逻辑回归的输出正是[0,1]区间参数估计方法:https://blog.csdn.net/lx_ros/a...

2019-08-08 20:47:10 99

原创 集成学习task1

1、集成学习的概念结合多个个体学习器完成任务2、个体学习器的概念具有特定算法可构成集成学习的学习器3、boosting bagging的概念、异同点https://www.cnblogs.com/liuwu265/p/4690486.html4、理解不同的结合策略(平均法,投票法,学习法)平均法:所有学习器预测结果的平均值作为最终预测结果投票法:所有学习器预测结果的众数最为最终预测...

2019-08-07 14:09:08 101

原创 task1

1机器学习的一些概念模型Y(预测)=F(X|θ)机器学习是调整参数θ的过程Y(实际)已标定为监督学习Y(实际)自我生成为无监督学习泛化能力为模型用于新样例的能力过拟合:学习过好,学习了样本的独有的属性防止过拟合,对过拟合的回归函数进行正则化的函数j(f),使经验风险和结构风险达到平衡的函数欠拟合:学习不够好,有些属性没有学习到2线性回归原理利用数理统计中的回归分析,来确定两种或...

2019-08-06 20:32:55 146

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除