自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 二手车价格预测-模型stacking融合

模型融合是比赛后期一个重要的环节,大体来说有如下的类型方式。1简单加权融合:回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean);分类:投票(Voting)综合:排序融合(Rank averaging),log融合2stacking/blending:构建多层模型,并利用预测结果再拟合预测。3boosting/bagging(...

2020-04-01 23:07:46 581

原创 二手车价格预测-随机森林建模及调参

随机森林模型在机器学习算法中近年来受到xgb模型,lgb模型的冲击,但其仍然十分流行,主要是其结果的得分无论在验证集还是测试集上都经得起考验,这里我们用随机森林模型来预测二手车价格的变化。前面已经做了数据的EDA以及特征工程,包括数据集也在下面的链接中,点击获取了解二手车交易价格数据分析EDA二手车交易价格特征工程随机森林:参数详解:sklearn.ensemble.RandomFore...

2020-03-31 19:23:05 2286

原创 二手车价格预测预测-特征工程

特征工程是比赛中最至关重要的的一块,特别的传统的比赛,大家的模型可能都差不多,调参带来的效果增幅是非常有限的,但特征工程的好坏往往会决定了最终的排名和成绩。特征工程的主要目的还是在于将数据转换为能更好地表示潜在问题的特征,从而提高机器学习的性能。比如,异常值处理是为了去除噪声,填补缺失值可以加入先验知识等。特征构造也属于特征工程的一部分,其目的是为了增强数据的表达。有些比赛的特征是匿名特征,...

2020-03-28 20:46:18 982

原创 二手车交易价格预测EDA

阿里天池新人赛——二手车交易价格预测EDA工作概述Datawhale与天池联合发起的0基础入门数据挖掘系列赛事第一场 —— 零基础入门数据挖掘之二手车交易价格预测大赛。赛事以二手车市场为背景,要求选手预测二手汽车的交易价格。这是典型的回归问题,除了数据量有二十万条比一些玩具数据集大得多之外,其他方面都适合小白上手二手车交易价格数据集及赛事描述探索性数据分析 EDA(Exploratory ...

2020-03-24 19:27:00 921

原创 小白深度学习入门的错题习题总结

关于softmax函数与分类模型1.softmax([100, 101, 102])的结果等于以下的哪一项softmax([10.0, 10.1, 10.2])softmax([-100, -101, -102])softmax([-2 -1, 0])softmax([1000, 1010, 1020])正确选项C,softmax([100,101,102])理解为线性代数的矩阵向量,...

2020-02-24 18:36:54 2333

原创 两个连续的3\times33×3卷积核的感受野与一个5\times55×5卷积核的感受野相同

关于卷积层,以下哪种说法是错误的:上面这题中,我们可以很容易得就得出了错误答案:第二个,原因就是对于高宽维度,只要输入的高宽(填充后的)大于或等于卷积核的高宽即可进行计算,很明显第二个选项是没考虑到填充的问题。举一反三,我们看看另外几个正确选项。第一个选项和第三个选项是概念性的东西,在这里不作描述。对于第四个选项两个连续的3×3卷积核的感受野与一个5×5卷积核的感受野相同在此我们做一...

2020-02-19 21:00:50 1722 2

原创 小白深度学习入门阶段入门

伯禹平台的深度学习动手入门学习,作为机器学习只懂一点的业务程序员来说,深度学习真的完全是小白,在此记录下第一个阶段学习的成果,也给有意入门深度学习的小白提供一点经验(闭坑)Step1:电脑配置要求首先深度学习是需要配置环境的,不知道作为小白的你一开始是不是也像我一样以为pip install torch这样子往往是会报错的:原因就是环境,对于每个非专业出身的业余程序爱好者的人来说,环...

2020-02-14 21:37:58 342

原创 语言模型——深度学习入门动手

语言模型一段自然语言文本可以看作是一个离散时间序列,给定一个长度为 T 的词的序列 w1,w2,…,wT ,语言模型的目标就是评估该序列是否合理,即计算该序列的概率:P(w1,w2,…,wT).本节我们介绍基于统计的语言模型,主要是 n 元语法( n -gram)。在后续内容中,我们将会介绍基于神经网络的语言模型。语言模型假设序列 w1,w2,…,wT 中的每个词是依次生成的,我们有P...

2020-02-14 19:41:50 211

原创 多层感知机——深度学习动手

多层感知机深度学习主要关注多层模型。在这里,我们将以多层感知机(multilayer perceptron,MLP)为例,介绍多层神经网络的概念。隐藏层下图展示了一个多层感知机的神经网络图,它含有一个隐藏层,该层中有5个隐藏单元。表达公式具体来说,给定一个小批量样本 X∈Rn×d ,其批量大小为 n ,输入个数为 d 。假设多层感知机只有一个隐藏层,其中隐藏单元个数为 h 。记隐藏层的...

2020-02-14 19:01:55 264

原创 softmax与分类模型——深度学习入门动手

softmax和分类模型softmax的基本概念分类问题一个简单的图像分类问题,输入图像的高和宽均为2像素,色彩为灰度。图像中的4像素分别记为 x1,x2,x3,x4 。假设真实标签为狗、猫或者鸡,这些标签对应的离散值为 y1,y2,y3 。我们通常使用离散的数值来表示类别,例如 y1=1,y2=2,y3=3 。权重矢量o1=x1w11+x2w21+x3w31+x4w41+b1o...

2020-02-14 18:55:39 243

原创 线性回归——深度学习入门动手学

线性回归模型为了简单起见,这里我们假设价格只取决于房屋状况的两个因素,即面积(平方米)和房龄(年)。接下来我们希望探索价格与这两个因素的具体关系。线性回归假设输出与各个输入之间是线性关系:price=warea⋅area+wage⋅age+b数据集我们通常收集一系列的真实数据,例如多栋房屋的真实售出价格和它们对应的面积和房龄。我们希望在这个数据上面寻找模型参数来使模型的预测价格与真实价格...

2020-02-14 18:44:40 164

原创 ValueError: setting an array element with a sequence.处理

笔者在训练Lasso回归模型的时候,报了ValueError: setting an array element with a sequence. 网上说很多都是数据维度不匹配的问题,但都没说该如何处理,自己在这里为同样身为小白爱好者的你提供一个比较直接的思路:STEP1:直接打印出报错的代码,看看类型和数据维度以此图为例,我们可以发现其实一个list类型,在列表里面还嵌套了一个array类...

2020-02-12 16:56:37 10943

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除