- 博客(19)
- 资源 (1)
- 收藏
- 关注
转载 机器学习算法基础——Task05 SVM
<div id="article_content" class="article_content clearfix"> <link rel="stylesheet" href="https://csdnimg.cn/release/phoenix/template/css/ck_htmledit_views-21113...
2020-05-01 21:55:54 3333
转载 Pandas——合并
知识结构以下内容转载自https://blog.csdn.net/weixin_42782150/article/details/89546357?utm_medium=distribute.pc_relevant.none-task-blog-OPENSEARCH-4&depth_1-utm_source=distribute.pc_relevant.none-task-blog-O...
2020-04-30 20:59:39 433
原创 Pandas——变形
知识结构梳理思考问题【问题一】 上面提到了许多变形函数,如melt/crosstab/pivot/pivot_table/stack/unstack函数,请总结它们各自的使用特点。【问题二】 变形函数和多级索引是什么关系?哪些变形函数会使得索引维数变化?具体如何变化?【问题三】 请举出一个除了上文提过的关于哑变量方法的例子。【问题四】 使用完stack后立即使用unstack一定能保证...
2020-04-28 22:55:27 173
原创 Pandas——分组
知识点结构图一、SAC过程内涵SAC指的是分组操作中的split-apply-combine过程其中split指基于某一些规则,将数据拆成若干组,apply是指对每一组独立地使用函数,combine指将每一组的结果组合成某一类数据结构apply过程在该过程中,我们实际往往会遇到四类问题:整合(Aggregation)——即分组计算统计量(如求均值、求每组元素个数)变换(Trans...
2020-04-26 21:11:35 212
原创 机器学习算法基础——Task03 EM算法
1.EM算法原理EM算法——最大期望算法(Expectation-maximization algorithm,又译期望最大化算法)在统计中被用于寻找,依赖于不可观察的隐性变量的概率模型中,参数的最大似然估计。在统计计算中,最大期望(EM)算法是在概率模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐性变量。最大期望算法经常用在机器学习和计算机视觉的数据聚类(Dat...
2020-04-25 21:32:49 256
原创 机器学习算法基础——Task02朴素贝叶斯
1.朴素贝叶斯“朴素”在哪里?朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法 。最为广泛的两种分类模型是决策树模型(Decision Tree Model)和朴素贝叶斯模型(Naive Bayesian Model,NBM)。和决策树模型相比,朴素贝叶斯分类器(Naive Bayes Classifier 或 NBC)发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同时,...
2020-04-23 20:56:32 1445
原创 Pandas——索引
主要知识结构框架相关细节内容请参https://github.com/datawhalechina/joyful-pandas/blob/master/%E7%AC%AC2%E7%AB%A0%20%E7%B4%A2%E5%BC%95.ipynb内容可以说是细致入微,以上知识框架是对整体内容做的一个归纳整理,方便快速了解这一部分的知识结构。以下是在学习过程中自己思考的几个小问题:1、lo...
2020-04-23 20:15:57 224
原创 机器学习算法基础——Task01线性回归
1、 线性回归简介1.1 什么是回归分析回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系。通常使用曲线/线来拟合数据点,目标是使曲线到数据点的距离差异最小。1.2 线性回归线性回归是回归问题中的一种,线性回归假设目标值与特征之间线性相关,即满足一个多元一次方程。通过构建损失函数,来求解损失...
2020-04-21 12:25:16 517
原创 Pandas基础
读写文件读写基本数据结构SeriesDataFrame常用函数head和taildf.head()df.tail()unique和nuniquecount和value_countsdescribe和infoidxmax和nlargestclip和replaceapply函数排序索引排序df.set_index(‘Math’)....
2020-04-20 20:36:50 127
原创 动手学深度学习——学习笔记(Task2)
文本是一类序列数据,一篇文章可以看作是字符或单词的序列,本节将介绍文本数据的常见预处理步骤,预处理通常包括四个步骤: 读入文本分词建立字典,将每个词映射到一个唯一的索引(index)将文本从词的序列转换为索引的序列,方便输入模型
2020-02-14 18:59:47 188
原创 动手学深度学习——学习笔记(Task1)
作为机器学习的一类,深度学习通常基于神经网络型逐级表示越来越抽象的概念或模式。我们先从线性回归和 softmax 回归这两种单层神经网络,简要介绍机器学习中的基本概念。然后,我们由单层神经网络延伸到多层神经网络,并通多层感知机引出深度学习模型。在观察和了解了模型的过拟合现象后,我们将介绍深度学习中对过拟合的常用方法:权重衰减和丢弃法。#线性回归线性回归输出是一个连续值,因此适用于回归...
2020-02-14 18:08:56 152
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人