自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 全新神经网络架构KAN回归分析:PDP(部分依赖图)、ICE(个体条件期望)解释教程

这里创建一个KAN:8D输入(自变量),1D输出(因变量),2个隐藏的神经元,三次样条 (k=3),3个网格间隔 (grid=3),读者可以利用网格细化来最大限度地提高 KAN 的拟合功能能力,修改网格间隔得到更细粒度的KAN,以及修改其它参数来增加模型拟合度,这里就不去展示如何去进行模型调参,接下来训练模型。到这一步我们就完成了KAN模型的评价,利用拟合的公式对测试集数据进行预测,并进行真实值、预测值散点可视化,最后输出模型各种评价指标,如果不满这个拟合效果,可以对模型进行参数调整以得到最优模型。

2024-07-07 18:39:22 779

原创 论文作图 seaborn 实现多边缘可视化

这是一个简单的联合分布,边缘可视化只存在一种可视化类型——密度图,而在论文中一般会看到边缘分布可视化会存在多种类型的可视化,如何绘制这种可视化呢?这里边缘可视化存在柱状图、密度图两种可视化,读者可根据自己的需求去添加修改可视化类型,这里由于数据原因密度图并不明显,下面更换指标再进行可视化。,对于其中如何根据联合分布图绘制多边缘可视化存在疑问这里以一篇短小的文章来实现这个可视化。由于复制粘贴会损失图片dpi请移步公众号原文观看获得更好的观感效果(关注公众号获得更多。

2024-07-07 18:29:22 873

原创 SOFTS模型的单特征时间序列预测实现

交叉验证输出的预测结果:交叉验证通常会对数据进行多次划分,每次划分得到一个模型,并对验证集进行预测,因此,nf_preds 中包含了多次预测的结果,每次预测结果可能会略有不同,这里选择最佳预测结果:通过计算每个时间点的预测误差,并选择误差最小的预测结果,可以提高模型在验证集上的表现评估,这里的DataFrame各指标的含义为:单个时间点的唯一标识符、时间戳、预测截止时间、模型预测值、实际观测值以及它们之间的误差。h=horizon:预测的时间跨度,即模型要预测的未来时间点数量。

2024-07-06 12:00:33 630

原创 综合多种梯度提升模型:LightGBM、XGBoost、CatBoost与NGBoost的集成预测

如果你对类似于这样的文章感兴趣。欢迎关注、点赞、转发~

2024-07-06 11:52:36 1212

原创 决策树和随机森林的决策过程路径可视化解读

如果你对类似于这样的文章感兴趣。欢迎关注、点赞、转发~。

2024-07-05 16:12:45 262

原创 时间序列预测神器Prophet python实现

总体而言,Prophet模型通过这些组件的组合来建模时间序列数据中的趋势、季节性、假期效应和噪声。"Prophet" 指的是由 Facebook 开发的一种用于时间序列分析和预测的工具。Prophet 在 R 和 Python 中都有实现,由于其能够以极小的工作量生成准确且易于解释的预测,因此在各个行业中广受欢迎。要使用 Prophet,通常需要提供一个包含两列的时间序列数据集:'ds'(日期)和 'y'(要预测的值)。可调参数:可以调整各种参数以定制模型的行为,例如季节性组件的强度和趋势的灵活性。

2023-12-02 13:55:51 1044 1

转载 主成分分析PCA

使得原始数据从64*1797变为13*1797,通过这样的操作,实现了对手写数字数据集的降维,保留了累计贡献率大于80%的主成分。如果需要保留尽可能多的信息以最大程度地保持数据的结构和特征,那么可以选择更高的累计贡献率。累计贡献率大于90%:如果对数据的信息损失非常敏感,可以选择一个更高的阈值,例如累计贡献率大于90%。累计贡献率大于80%:这是一个常见的起始点,特别是在维度减少的情况下,选择累计贡献率大于80%的主成分通常可以保留大部分数据的信息,同时降低维度。执行数据的中心化操作。

2023-12-01 14:00:52 288 1

转载 python交互性可视化

可以进行高效、清晰的数据分析和表示,帮助将数据从Pandas DataFrame转换为易于观察的交互式数据透视表,便于对数据进行探索和分析,特别是在处理大型数据集或希望为用户提供灵活工具以探索数据关系时非常有用。使用工具如:Pivottablejs、Plotly、Bokeh等,可以创建交互性的图表和图形,让用户能够直观地理解数据趋势、关系和分布。利用Pivottablejs生成交互式的数据透视表,通过在表格上拖动字段以及对字段进行放置,实现对数据的动态汇总和分析,以更直观地理解数据的关系。

2023-12-01 13:54:58 285 1

原创 t-sne算法python实现

t-SNE的主要目标是保持相似性关系,即在高维空间中距离较近的数据点在低维空间中仍然保持较近的距离,而距离较远的数据点在低维空间中仍然保持较远的距离。然而,需要注意的是,t-SNE的计算复杂性较高,对数据的不同初始化和参数选择可能会导致不同的结果,因此需要谨慎使用和解释。这些分布衡量了在高维空间中给定数据点之间的相似性时,对应的低维空间中数据点的相似性。计算相似度:首先,计算高维数据中每对数据点之间的相似度。初始化低维嵌入:随机初始化低维空间中的数据点位置,这些点通常是在低维空间中的均匀分布。

2023-11-02 19:17:30 285 1

原创 Seaborn的15种可视化图表详解

数据导入。

2023-10-29 18:17:56 80 1

原创 2021 年高教社杯全国大学生数学建模竞赛 E 题 中药材的鉴别 第二题

问题 2. 根据附件 2 中某一种药材的中红外光谱数据,分析不同产地药材的特征和差异性,试鉴别药材的产地,并将下表中所给出编号的药材产地的鉴别结果填入表格中。

2023-10-22 12:23:23 865 1

原创 正则化算法

1正则化倾向于产生稀疏解,适用于特征选择和简化模型;而L2正则化倾向于产生较小但非零的参数值。

2023-10-22 11:47:06 45 1

原创 K-近邻算法

【代码】K-近邻算法。

2023-10-22 11:42:44 34 1

原创 可视化展示逻辑回归决策边界

可视化展示逻辑回归决策边界。

2023-10-22 11:38:45 253 1

原创 LSTM模型预测股票价格

围绕 LSTM(Long Short-Term Memory)神经网络的原理,展示如何使用Python和深度学习库Keras构建LSTM模型,以及如何使用这个模型来预测时间序列数据。以股票价格预测为例,这是LSTM在金融领域的常见应用。LSTM 用于处理序列数据,如时间序列、文本和音频。相对于传统的RNN,LSTM更擅长捕获长期依赖关系,因为它包含了一种称为"门"的机制,可以控制信息的流动。。

2023-10-21 20:19:08 599 2

原创 天气数据的爬虫获取与建模分析

作为气象专业常见的图表之一,风玫瑰图主要用来统计一段时间内风向、风速发生的频率,其花瓣越长表示该风向的频率越高,单个花瓣上的不同颜色表示风速的分布情况。天气预报的制作和发布是非常复杂的过程,现行的天气预报的发布一般包括数据收集、数据分析、预报会商、产。本部分将尝试使用机器学习中的回归算法,对北京的次日最高气温进行预测,并评估模型的性能。多元线性回归与一元线性回归类似,只是多元线性回归需要添加预测变量的数量及其相应的系数。利用机器学习,通过一元线性回归、多元线性回归的方法,对气温进行预测。

2023-09-25 10:02:46 1050 1

原创 2023年第二届全国大学生数据统计与分析竞赛题目B:电影评分的大数据分析第二问

排名前 250 名电影的评分与评论人数、国家、导演和电影类型是否有关系?请分析附件 1 中排名前 250 名电影的上映年份主要集中在哪。

2023-06-10 11:39:30 1363

原创 2023年第二届全国大学生数据统计与分析竞赛题目B:电影评分的大数据分析

在大数据时代背景下,统计学作为大数据分析领域的基础显得尤为重要。为了帮助学生更好的学习和应用数据统计与分析的知识,促进统计、计算机、数学等相关专业的发展,培养具有数据分析与应用型人才,经研究决定,中国国际经济技术合作促进会教育发展工作委员会决定主办“第二届全国大学生数据统计与分析竞赛”(以下简称“竞赛”),为我国数据统计与分析行业提供人才支持,夯实人才队伍基础。欢迎各高等院校按照竞赛章程及有关规定组织同学报名参赛。

2023-06-09 23:09:30 1839 2

原创 2023年第二十届五一数学建模竞赛 B题:快递需求分析问题

基于熵权法.Topsis评价

2023-04-28 23:54:21 3624 1

原创 2021 年高教社杯全国大学生数学建模竞赛 E 题 中药材的鉴别 第一题

数据预处理>特征值提取>聚类分析>类别差异分析

2023-04-14 02:53:44 6487 12

原创 2021 年高教社杯全国大学生数学建模竞赛 E 题 中药材的鉴别

2021 年高教社杯全国大学生数学建模竞赛 E 题 中药材的鉴别

2023-04-14 02:40:19 1001

原创 第十一届泰迪杯B题:产品订单的数据分析与需求预测

2. 基于上述分析,建立数学模型,对附件预测数据(predict_sku1.csv)中给出的产品,预测未来3月(即2019年1月、2月、3月)的月需求量,将预测结果按照表3的格式保存为文件result1.xlsx,与论文一起提交。附件中的预测数据(predict_sku1.csv)提供了需要预测产品的销售区域编码、产品编码、产品品类和产品细品类(格式见表2)。(2) 产品所在区域对需求量的影响,以及不同区域的产品需求量有何特性;(3) 不同销售方式(线上和线下)的产品需求量的特性;

2023-03-21 14:27:55 11972 28

2021 年高教社杯全国大学生数学建模竞赛 E 题 中药材的鉴别 数据

2021 年高教社杯全国大学生数学建模竞赛 E 题 中药材的鉴别 数据

2023-04-14

3_4_双子大厦(Y).GST

3_4_双子大厦(Y).GST

2022-10-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除