![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 56
懒惰的coder
这个作者很懒,什么都没留下…
展开
-
PyTorch中torch.sum()函数的用法总结
【代码】PyTorch中torch.sum()函数的用法总结。原创 2023-05-28 13:32:30 · 867 阅读 · 0 评论 -
python画混淆矩阵
【代码】python画混淆矩阵。原创 2023-03-07 20:23:37 · 240 阅读 · 0 评论 -
Python中numpy中的切片操作[:, : -1] [:, [-1] ]
切分,取除最后一列外的所有元素。原创 2022-11-11 19:29:43 · 916 阅读 · 0 评论 -
幂律分布(python)
首先要说的是中心极限定理——在复杂的多因素情况下,只要个体相互独立,集体效果就应该是正态分布。然而实际运用中,尤其是金融中,更多面对的是尖峰胖尾现象,比如下面这幅图描述的是标普500指数的收益率分布,很明显的是,实际的收益率的分布和理想中的正态分布不一致,这就是所谓的尖峰胖尾特征,峰值更高,尾巴部分也拖的更长更厚。正是有了尖峰胖尾,可以想象,有些东西可以超出想象的大,并且出现这个的概率也非常大,这样的陡峭且延长很长的分布就是所谓的幂律分布(两个特征:陡峭,延长很长)。幂律分布就是概率密度函数服从幂函数的分原创 2022-07-02 23:18:07 · 2072 阅读 · 2 评论 -
时间序列分析-针对时间序列的特殊方法
时间序列分析-针对时间序列的特殊方法本文依据知乎大佬的文章平稳性 许多时间序列的统计学模型都是依赖于时间序列是平稳性的这一前提条件,通常来说,一个平稳的时间序列指的是这个时间序列在一段时间内具有稳定的统计值,如均值,方差。由于我们对于一个数据是否平稳是有自己的直觉的,所以在实践的过程中要谨防过于依赖直觉而被直觉所欺骗。为此我们引入了一些统计上的假设检验来测试一个时间序列数据的平稳性。 其中Augmented Dickey Fuller Test (ADF Test) 是最常使用的一种方法,转载 2022-02-28 23:39:42 · 1549 阅读 · 0 评论 -
神经网络发展历程
神经网络发展历程神经元1.引子 对于神经元的研究由来已久,1904年生物学家就已经知晓了神经元的组成结构。 一个神经元通常具有多个树突,主要用来接受传入信息;而轴突只有一条,轴突尾端有许多轴突末梢可以给其他多个神经元传递信息。轴突末梢跟其他神经元的树突产生连接,从而传递信号。这个连接的位置在生物学上叫做“突触”。 人脑中的神经元形状可以用下图做简单的说明: 1943年,心理学家McCulloch和数学家Pitts参考了生物神经元的结构,发表了抽象的神经元模型MP。在下文中,我们会具体介原创 2022-02-06 00:13:51 · 3708 阅读 · 1 评论 -
时间序列分析—缺失值处理
时间序列分析—缺失值处理本文依据知乎大佬的文章清洗数据数据清洗是数据分析的一个重要环节,对于时间序列数据也不例外,本节将详细介绍针对时间序列数据的数据清洗方法。缺失值处理改变时间频率平滑数据处理季节性问题防止无意识的向前看缺失值处理缺失值的出现很常见,例如在医疗场景中,一个时间序列数据出现缺失可能有以下原因:病人没有遵从医嘱病人的健康状态很好,因此没必要在每个时刻都记录病人被忘记了医疗设备出现随机性的技术故障数据录入问题最常用的处理缺失值的方法包括填补(imputat转载 2022-01-21 12:13:27 · 10357 阅读 · 2 评论 -
时间序列数据分析—概述
时间序列数据分析—概述本文依据知乎大佬的文章概述 随着工业界大规模时间序列数据(例如物联网,医疗数字化,智慧城市等领域)的出现和算力的提升,时间序列数据分析的重要性日益凸显。因此伴随着大量时间序列数据被检测和收集,对于基于统计学和机器学习的具有竞争力的分析方法的需求也越来越强。因此在之后的章节中,我们将对时间序列数据分析进行一个全面的探讨。时间序列分析的定义时间序列分析是指从按时间排序的数据点中抽取有价值的总结和统计信息的行为时间序列分析既包含了对过去数据的诊断,也包括对未来数据的预测。转载 2022-01-13 23:29:47 · 2256 阅读 · 0 评论 -
线性回归-理论
线性回归-理论以下面图片中的数据为例进行分析数据:工资和年龄两个特征目标:预测银行能够带给我多少钱思考:工资和年龄都会影响最终银行贷款的结果那它们各自能产生多大的影响假设工资和年龄对贷款的影响分别为1和2拟合的平面:整理后: 误差分析真实值与预测值之间一定存在误差(用ε来表示误差)对于每一个样本 ( y(i)为真实值, θT为参数矩阵, x(i)为第i挑数据的属性内容矩阵, ε(i)为第i条数据所产生的误差)(上图中红色的点表示真实值,垂线与平面的交点为预测原创 2021-12-22 16:11:23 · 684 阅读 · 0 评论 -
机器学习步骤
机器学习步骤数据准备(DATA PREPARATION)数据收集数据清洗数据增强特征工程(FEATURE ENGINEERING)特征选择特征构建特征提取模型生成(MODEL GENERATION)模型优化方法选择模型评估(MODEL EVALUATION)模型训练模型调优...原创 2021-12-22 16:10:25 · 288 阅读 · 0 评论 -
2021-11-02
代价函数、损失函数、目标函数区别转载 2021-11-02 15:26:41 · 64 阅读 · 0 评论