
数学建模/大数据分析与可视化
文章平均质量分 81
早知此专栏,数学建模/大数据竞赛早拿奖,受益终生。通过本专栏您将收获,熟悉Python编程,数据分析/挖掘流程流程:数据预处理、探索性分析与可视化、特征工程/特征选择、算法模型/调参优化、模型评估、模型融合。熟悉常用数学建模模型和统计分析,能做出精美可视化图表。get数据竞赛方案和获奖经验分享。
叶庭云
做的所有努力都是为了降低不确定性,提升概率。
展开
-
手把手教你配置Anaconda+Pycharm开发环境
手把手教你配置Anaconda+Pycharm开发环境一、前言1. Anaconda介绍2. Pycharm介绍编码协助项目代码导航代码分析Python重构支持Django框架集成版本控制二、下载Anaconda和Pycharm1. 下载Anaconda2. 下载Pycharm三、安装Anaconda和Pycharm1. 安装Anaconda2. 安装Pycharm原创 2021-02-08 08:32:53 · 2905 阅读 · 2 评论 -
上手jupyter notebook神器
上手jupyter notebook神器。jupyter notebook 的安装与使用、Magic 命令三配置Notebook:更改默认工作目录、更换皮肤主题。原创 2021-02-05 21:28:46 · 2003 阅读 · 19 评论 -
Python分析了5万条相亲网站数据 | 看相亲男女画像
用Python分析了5万条相亲网站数据,看相亲男女画像。原创 2021-02-07 13:19:49 · 5196 阅读 · 20 评论 -
Python 数据竞赛常用 | 可视化数据集缺失情况
Python 数据竞赛常用 | 可视化数据集缺失情况无论是打比赛还是在实际工程项目中,都会遇到数据缺失的情况,如果数据集较小,还能在 Excel 或者其他可视化软件大致看一下导致数据缺失的原因。但当数据集较大时,手工查看每个变量的缺失值是非常麻烦的一件事情。原创 2022-05-01 15:44:13 · 3261 阅读 · 1 评论 -
Python 详解箱型图法剔除异常值
Python 详解箱型图法剔除异常值原创 2022-06-21 22:06:51 · 6659 阅读 · 0 评论 -
R 语言中的 pnorm 方法与 Python scipy 的 norm.cdf、norm.sf 等价
R 语言中的 pnorm 方法与 Python scipy 的 norm.cdf、norm.sf 等价。pnorm 函数在统计学和数据分析中非常有用,可以帮助我们计算正态分布下的累积概率,从而进行假设检验、置信区间估计等任务。原创 2023-10-18 23:20:42 · 1972 阅读 · 1 评论 -
数学建模 优质的信息检索渠道和工具
优质的信息检索渠道和工具对数学建模比赛获奖有着重要的影响。知识获取:优质的信息检索渠道和工具可以帮助参赛者快速、有效地获取相关领域的知识和信息,包括理论知识、方法论、模型及解决策略等。这些信息将帮助参赛者构建强大的理论基础,从而提高模型建立的准确性和有效性。问题理解:对于复杂的建模问题,需要广泛的背景知识和深入的理解。优质的信息检索工具可以帮助参赛者查找到相关的学术文章、技术报告、行业数据等,进一步理解和深化对问题背景的理解,这对于建立有效的数学模型至关重要。原创 2023-08-22 23:30:56 · 387 阅读 · 0 评论 -
美赛数学建模 | 信息检索与竞赛工具 降低信息差
美赛数学建模 | 信息检索与竞赛工具 降低信息差原创 2023-02-06 17:34:30 · 1047 阅读 · 1 评论 -
Python GPU 加速数据科学 | 计算距离矩阵在用 cuPy 时快了约 100 倍
Python 数据科学 GPU 加速优化 | 计算距离矩阵在用 cuPy 时快了约 100 倍原创 2023-01-31 18:32:58 · 1705 阅读 · 0 评论 -
高斯秩变换 RankGauss 可能是比标准化/归一化更有效的连续值特征变换方法
高斯秩变换 RankGauss 可能是比标准化/归一化更有效的连续值特征变换方法原创 2023-01-25 20:46:02 · 1383 阅读 · 1 评论 -
pandarallel 是一个简单而有效的工具,可以在所有可用的 CPUs 上并行执行 pandas 操作
pandarallel 是一个简单而有效的工具,可以在所有可用的 CPUs 上并行执行 pandas 操作。原创 2023-01-23 14:06:43 · 1004 阅读 · 0 评论 -
pqdm 是 tqdm 和 concurrent.futures 的 wrapper | 一个小而美的 Python 并行计算库 | 实现多进程显示进度条的优雅方案
pqdm tqdm 和 concurrent futures 的 wrapper 实现多进程显示进度条的优雅方案 | 一个小而美的 Python 并行计算库原创 2022-12-21 22:03:47 · 1103 阅读 · 0 评论 -
动态模态分解 DMD | 做高维时间序列数据短时预测
动态模态分解 DMD | 做高维数据短时预测。通过这篇博客您将收获:(1)熟悉动态模态分解(DMD)的关键原理和重要的数学推导;(2)掌握利用 DMD 做多元时间序列预测任务的技术;(3)相关的有价值的资料分享,用于补充学习和拓展。原创 2022-10-14 15:06:19 · 3561 阅读 · 2 评论 -
详解基于 LightGBM 与傅里叶基函数的 LazyProphet 原理和实践 | 快速做单变量时间序列预测
详解基于 LightGBM 与傅里叶基函数的 LazyProphet 原理和实践 | 快速做单变量时间序列预测原创 2022-10-13 23:25:03 · 2594 阅读 · 3 评论 -
Python 机器学习 | 超参数优化 黑盒(Black-Box)非凸优化技术实践
Python 机器学习 | 超参数优化 黑盒(Black-Box)非凸优化技术实践原创 2022-08-17 22:01:10 · 2283 阅读 · 0 评论 -
Python | 快速获取某一列数组中前 N 个最大值/最小值的索引 | 三种方法总结
Python | 快速获取某一列数组中前 N 个最大值/最小值的索引 | 三种方法总结原创 2022-08-16 15:33:36 · 5230 阅读 · 1 评论 -
Python 详解计算 Median Absolute Deviation(绝对中位偏差)| 还可用于异常值检测
Python 详解计算 Median Absolute Deviation(绝对中位偏差)| 还可用于异常值检测原创 2022-08-16 12:49:10 · 2134 阅读 · 0 评论 -
Python numpy | 详解 np.unique() 的妙用 去重 + 重排序、统计出现次数
Python numpy | 详解 np.unique() 的妙用 去重 + 重排序、统计出现次数原创 2022-08-14 16:58:53 · 3325 阅读 · 0 评论 -
数据竞赛知识点 | 数值特征的缩放与编码
数据竞赛知识点 | 数值特征的缩放与编码原创 2022-08-13 10:47:00 · 796 阅读 · 0 评论 -
Python 中调用 R 语言 | rpy2 的安装和使用 | 完美解决各种问题并成功配置好
Python 中调用 R 语言 | rpy2 的安装和使用 | 完美解决各种问题并成功配置好原创 2022-07-19 10:50:21 · 2621 阅读 · 0 评论 -
数学建模不会 LaTex 排版 | 教你如何在 Word 中优雅地使用漂亮的 LaTex 公式
数学建模不会 LaTex 排版 | 教你如何在 Word 中优雅地使用漂亮的 LaTex 公式原创 2022-07-16 16:29:34 · 4333 阅读 · 0 评论 -
机器学习 | 总结 CatBoost 的 5 个独特功能
机器学习 | 总结 CatBoost 的 5 个独特功能,其他梯度提升算法(AdaBoost、、GBDT、XGBoost、LightGBM)不具备这些特点。原创 2022-07-15 15:21:36 · 1666 阅读 · 0 评论 -
Python 数据处理 | 详解缩尾处理(winsorize)和代码实践
Python 数据处理 | 详解缩尾处理(winsorize)和代码实践原创 2022-07-09 14:33:24 · 12804 阅读 · 0 评论 -
高效的大型时间序列数据压缩方法 MidiMax 压缩算法 | 让时间序列可视化更容易
高效的大型时间序列数据压缩方法 MidiMax 压缩算法 | 让时间序列可视化更容易原创 2022-07-07 10:07:16 · 1913 阅读 · 0 评论 -
机器学习 | 简单但是能提升模型效果的特征标准化方法(RobustScaler、MinMaxScaler、StandardScaler 比较和解析)
简单但是能提升模型效果的特征标准化方法(RobustScaler、MinMaxScaler、StandardScaler 比较和解析)原创 2022-07-02 22:34:50 · 1975 阅读 · 0 评论 -
Python Akima 插值法教程 | 关键原理和实践
Python Akima 插值法教程 | 关键原理和实践原创 2022-06-30 18:11:19 · 3147 阅读 · 1 评论 -
机器学习 Out-of-Fold 折外预测详解 | 使用折外预测 OOF 评估模型的泛化性能和构建集成模型
机器学习 Out-of-Fold 折外预测详解 | 使用折外预测 OOF 评估模型的泛化性能和构建集成模型原创 2022-06-27 21:25:44 · 1812 阅读 · 0 评论 -
Python 时间序列异常点检测 | tsmoothie 基于数据平滑/拟合的方法 简单却快速有效
Python 时间序列异常点检测 | tsmoothie 基于数据平滑/拟合的方法 简单却快速有效原创 2022-06-29 22:22:24 · 2400 阅读 · 0 评论 -
Python 数据可视化教程 绘制精美的双 Y 轴折线图
Python 数据可视化教程 绘制精美的双 Y 轴折线图原创 2022-06-26 18:38:42 · 4644 阅读 · 0 评论 -
Python 时间序列异常点检测 | 详解 S-ESD 和 S-H-ESD
Python 实践 时间序列异常点检测 | 详解 S-ESD 和 S-H-ESD原创 2022-06-26 16:16:39 · 2313 阅读 · 1 评论 -
Python 轻松解决从 K 个字符串数组中任意取一个字符串,按顺序拼接,列出所有可能的字符串组合。(对比用库和不用库的方法)
Python 轻松解决从 K 个字符串数组中任意取一个字符串,按顺序拼接,列出所有可能的字符串组合。(对比用库和不用库的方法)原创 2022-06-23 14:34:24 · 2173 阅读 · 0 评论 -
Python正则表达式 | 如何只提取中文、英文字母、数字(含科学计数法)
Python正则表达式 | 如何只提取中文、英文字母、数字(含科学计数法)原创 2022-06-23 13:47:09 · 3859 阅读 · 0 评论 -
微软 AutoML 框架之 FLAML | 论文解读
微软 AutoML 框架之 FLAML | 论文解读FLAML(A Fast and Lightweight AutoML Library),是由微软主推的一个全新的高效轻量级自动化机器学习框架。原创 2022-06-23 12:23:11 · 1092 阅读 · 1 评论 -
微软 AutoML 框架之 FLAML | 环境配置、安装、分类/回归测试
微软 AutoML 框架之 FLAML | 环境配置、安装、分类/回归测试原创 2022-06-23 11:33:55 · 1249 阅读 · 0 评论 -
Python 时间序列预测 | 详解 STL 算法和预测实践
Python 时间序列预测 | 详解 STL 算法和预测实践原创 2022-06-21 10:11:03 · 2511 阅读 · 0 评论 -
Python 时间序列数据平滑去噪 Savitzky-Golay滤波器
Python 时间序列数据平滑去噪 Savitzky-Golay滤波器总结了Savitzky-Golay滤波器的原理和scipy的调用方法,并可视化滤波前后的结果,便于对比分析。原创 2022-06-19 16:05:57 · 6667 阅读 · 0 评论 -
Python 详解K-S检验与3σ原则剔除异常值
Python 详解K-S检验与3σ原则剔除异常值原创 2022-06-16 20:46:11 · 4098 阅读 · 4 评论 -
Python分析捕食者和被捕食者模型 Lotka--Volterra方程 | 拟合求解a,b,c,d
捕食者和被捕食者模型(Predator-Prey Model)是生态学中非常经典的一个模型。假设一个生态系统中有两个物种,其中一个为食草动物,两者分别构成了捕食者和被捕食者。以兔子和狐狸为例:可视化捕食者和被捕食者数量随时间变换情况;利用 numpy 的 polyfit、poly1d 拟合数据点分别得到两个多项式方程;scipy求导并代入值计算;等式两边的输入都有了,用多元线性回归(fit_intercept=False,不要截距)拟合数据,分别估计方程两个参数;最终得到a,b,c,d原创 2022-05-11 11:59:48 · 5079 阅读 · 2 评论 -
如何在Word中添加漂亮的代码块 | 很全的方法整理和比较
网上已有的方法总结下来主要有以下几种:planetB | Syntax Highlight Code In Word DocumentsPycharm/VSCode等集成开发环境里的代码直接复制贴到 Word 里,会保持代码高亮的效果。或者使用 Typora/Notepad++ 等软件转化样式再贴到Word。以及利用现有的 MarkDown 排版工具的代码高亮,然后再贴到Word,比如:Md2All、MarkDownNice。...原创 2022-04-21 09:00:00 · 13297 阅读 · 2 评论 -
Python colorama | 详解终端漂亮的彩色打印怎么实现的
Python | 详解终端漂亮的彩色打印怎么实现的原创 2022-04-11 21:10:41 · 4070 阅读 · 0 评论