- 博客(5)
- 收藏
- 关注
原创 蓝桥杯--
多个最小公倍数的求解 在网上普遍都是用暴力算法,在一些比较大的数运算时时间可能比较久,所以用了GCD求LCM的方法,以循环的方法解出。这种方法可能还可以有所改进,改进方向是求公因数有些重复的地方,等以后探究! #include<iostream> #include<bits/stdc++.h> using namespace std; #define N 3 int GCD(int n,int m) { if(n % m == 0) return m; else ret
2021-03-13 11:02:32 156
原创 数据挖掘小白之旅task5
模型融合目标 对于多种调参完成的模型进行模型融合。 完成对于多种模型的融合,提交融合结果并打卡。 内容介绍 模型融合是比赛后期一个重要的环节,大体来说有如下的类型方式。 简单加权融合: 回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean); 分类:投票(Voting) 综合:排序融合(Rank averaging),log融合 sta...
2020-04-04 19:40:31 86
原创 数据挖掘task4
建模与调参 线性回归模型: 线性回归是一种被广泛应用的回归技术,也是机器学习里面最简单的一个模型,它有很多种推广形式,本质上它是一系列特征的线性组合,在二维空间中,你可以把它视作一条直线,在三维空间中可以视作是一个平面。 线性回归最普遍的形式是f(x)=w’x+b; 其中x向量代表一条样本{x1,x2,x3…xn},其中x1,x2,x3代表样本的各个特征,w是一条向量代表了每个特征所占的权...
2020-03-31 17:36:30 135
原创 数据挖掘的小白之旅taks3
特征工程 异常处理 通过箱线图(或 3-Sigma)分析删除异常值; BOX-COX 转换(处理有偏分布); 长尾截断; 代码部分 (前面主要是利用四分位数的方法处理,然后用箱型图展示处理后的图像) `def outliers_proc(data, col_name, scale=3): “”" 用于清洗异常值,默认用 box_plot(scale=3)进行清洗 :param data...
2020-03-27 19:11:44 188
原创 数据挖掘基础知识与比赛的了解 task1
task2 怀着紧张的心情开启了自己第一次关于数据方面的比赛之旅,有挑战,也有期待。 关于赛题 理解赛题 对赛题背景要了解,不要一拿到赛题就拿代码,拿数据去跑; 数据中会有很多异常值,我们要对错误值、缺失值等等进行数据清洗; 比赛分类通常为三种,分类问题,回归问题,其他问题,本次比赛的二手车交易是一个回归问题,用已有之前的数据进行回归分析来预测以后的二手车的价格等等; 泛化能力要强,做出的模型要...
2020-03-23 21:31:00 124
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人