- 博客(6)
- 收藏
- 关注
原创 数据挖掘 - 模型融合
“如果你没有什么好的思路的话,那么就模型融合吧!”简单加权融合:1.1 回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean);对于回归问题,一个简单直接的思路是取平均。稍稍改进的方法是进行加权平均。权值可以用排序的方法确定,举个例子,比如A、B、C三种基本模型,模型效果进行排名,假设排名分别是1,2,3,那么给这三个模型赋予的权值...
2020-04-04 21:14:25 352
原创 数据挖掘 - 建模调参
使用交叉验证选择模型在实际操作中特征和模型是需要不断尝试改进完善的;小雨大佬的经验是使用贪心策略先选择一个简单的模型,在这个模型上进行特征工程,将特征部分做到目前想不到办法能做任何改进的时候,再用交叉验证或者根据实际情况设计验证方法选择合适的模型。模型验证方法...
2020-04-01 21:45:13 165
原创 数据挖掘 - 特征工程
数据探索在机器学习中我们一般称为EDA(Exploratory Data Analysis):是指对已有的数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。...
2020-03-28 21:03:06 390
原创 数据预处理-对数变换
这里写自定义目录标题数据分布的倾斜有很多负面的影响。我们可以使用特征工程技巧,利用统计或数学变换来减轻数据分布倾斜的影响。使原本密集的区间的值尽可能的分散,原本分散的区间的值尽量的聚合。Log变换通常用来创建单调的数据变换。它的主要作用在于帮助稳定方差,始终保持分布接近于正态分布并使得数据与分布的平均值无关。...
2020-03-24 21:13:11 4042
原创 matpltlib | 理解fig,ax = plt.subplots()
fig,ax = plt.subplots()等价于:fig = plt.figure()ax = fig.add_subplot(1,1,1)fig, ax = plt.subplots(1,3),其中参数1和3分别代表子图的行数和列数,一共有 1x3 个子图像。函数返回一个figure图像和子图ax的array列表。fig, ax = plt.subplots(1,3,1),最后一个参...
2019-05-17 10:44:44 862
原创 任意给定 n 个整数,求这 n 个整数序列的和、最小值、最大值
题目描述任意给定 n 个整数,求这 n 个整数序列的和、最小值、最大值输入描述输入一个整数n,代表接下来输入整数个数,0 < n <= 100,接着输入n个整数,整数用int表示即可。输出描述输出整数序列的和、最小值、最大值。用空格隔开,占一行思路:因为只需要最大最小值,所以不需要全部排序,也不需要储存,先设maxi,mini变量,初始值都等于第一...
2019-01-18 17:27:33 12891
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人