learning more-CSDN博客

原创机器学习算法竞赛系列二之数据探索+特征工程

数据探索可以分为三个部分:首先是赛前数据探索(即数据初探)，帮助我们对数据有个整体性的认识，并发现数据中存在的问题，比如缺失值、异常值和数据冗余等;其次是竞赛中的数据探索，通过分析数据发现变量的特点，帮助提取有价值的特征，这里可以从单变量、多变量和变量分布进行分析;最后是模型的分析，可以分为特征重要性分析和结果误差分析，帮助我们从结果发现问题，并进一步优化。

2023-11-16 22:53:13 167

原创机器学习算法竞赛系列一

机器学习竞赛网站，常用的评价指标等

2023-11-16 16:45:57 177

原创 Vision Transformer

224的图片，卷积核16、步距16，则得图片大小为14，14。

2023-08-29 15:47:53 4737

原创 Self-Attention与Multi-head Self-Attention

学习来源：https://blog.csdn.net/qq_37541097/article/details/118242600。

2023-08-29 14:12:47 76

原创 ShuffleNet_v1_v2

【代码】ShuffleNet_v1_v2。

2023-08-26 16:10:10 46

原创训练营第三期笔记一

初赛公开数据包含10296个样本，其中7833个样本为健康样本。每一个样本提供485512个位点的甲基化数据、年龄与患病情况。抽取80%作为训练样本，20%作为测试样本。

2023-08-17 13:50:23 129 1

原创折线图绘制

*kwargs : 第二组或更多(x,y,format_string)

2023-06-05 15:49:51 106

原创聚类算法用于降维，KMeans的矢量量化应用

【代码】聚类算法用于降维，KMeans的矢量量化应用。

2023-05-22 21:24:12 382

原创聚类分析基础

n_clusters是KMeans中的k，表示着要分几类。这是KMeans当中唯一一个必填的参数，默认为8类，但通常聚类结果会是一个小于8的结果。

2023-05-22 17:06:26 994 1

原创特征工程-特征选择

降维之外的所有特征选择的方法。过滤法更快速，但更粗糙。包装法和嵌入法更精确，比较适合具体到算法去调整，但计算量比较大，运行时间长。当数据量很大的时候，优先使用方差过滤和互信息法调整，再上其他特征选择方法。使用逻辑回归时，优先使用嵌入法。使用支持向量机时，优先使用包装法。迷茫的时候，从过滤法走起，看具体数据具体分析。

2023-05-21 15:56:06 780 1

原创随机森林在乳腺癌数据集上的调参案例

适合用网格搜索的参数：知道范围，或者说知道随着取值的变化模型怎么变化。适合先用学习曲线得到一个小区间的参数。

2023-05-15 15:42:21 79

原创使用随机森林填补缺失值

【代码】使用随机森林填补缺失值。

2023-05-15 13:22:06 748 1

原创基于MLP的MNIST数据集上的GAN网络实现

【代码】基于MLP的MNIST数据集上的GAN网络实现。

2023-05-14 17:01:18 219

np.linspace(0,0.5,20) 生成有顺序排列的随机的0-0.5的20个数。网格搜索只能对所有的参数都做选择就算不带一部分会更正确，网格搜索也不会放弃这个参数。parameters 一串参数和这些参数对应的希望网格搜索的参数的取值范围为。Gini系数取值为0-0.5 entropy 信息熵的取值为0-1。一般做两个参数、两个参数做网格搜索减少计算量。能够帮助我们同时调整多个参数的技术，枚举技术。计算量大尽量确定范围后搜索。

2023-05-14 16:42:15 241

原创 Alexnet网络模型

【代码】Alexnet网络模型。

2023-05-12 19:48:27 66 1

原创 LeNet网络代码实现

LeNet实现CIFER10数据的分类

2023-05-06 00:05:52 414

weixin_43242479的博客

原创机器学习小知识二

原创机器学习小知识一

原创机器学习算法竞赛系列二之数据探索+特征工程

原创机器学习算法竞赛系列一

原创 Vision Transformer

原创 Self-Attention与Multi-head Self-Attention

原创 EfficientNet

原创 densenet

原创 ShuffleNet_v1_v2

原创 MobileNet网络

原创 ResNet网络

原创 GoogleNet网络

原创 VGG网络实现

原创训练营第三期笔记一

原创 PCA与SVD

原创工业蒸汽量数据探索

原创画布与子图

原创折线图绘制

原创绘制饼图笔记

原创柱状图详解

原创 LeNet网络

原创聚类算法用于降维，KMeans的矢量量化应用

原创聚类分析基础

原创特征工程-特征选择

原创数据预处理

原创随机森林在乳腺癌数据集上的调参案例

原创使用随机森林填补缺失值

原创随机森林学习

原创基于MLP的MNIST数据集上的GAN网络实现

原创基于决策树的泰坦尼克号幸存者预测

原创 Alexnet网络模型

原创 LeNet网络代码实现

工业蒸汽量预测的模型融合

各类柱状图.ipynb

空空如也