![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 84
名字不要太长像我这样就好0
别 辜负今天
展开
-
Pandas 模糊查询与替换
主要用到的工具:Pandas 、fuzzywuzzyPandas:是基于numpy的一种工具,专门为分析大量数据而生,它包含大量的处理数据的函数和方法,以下为pandas中文API:缩写和包导入在这个速查手册中,我们使用如下缩写:df:任意的Pandas DataFrame对象s:任意的Pandas Series对象同时我们需要做如下的引入:import pa...原创 2018-12-07 16:43:49 · 20501 阅读 · 4 评论 -
经典的鸢尾花分类
数据的分类和处理是以后更要加强学习的部分,今天先把代码贴在这了,算是立一个flag# -*- coding:utf-8 -*-import pandas as pdimport numpy as npfrom sklearn.decomposition import PCAfrom sklearn.feature_selection import SelectKBest, Sele...原创 2018-12-07 17:36:06 · 1254 阅读 · 0 评论 -
PCA主成分分析
在机器学习中,当有大量的数据需要训练分析时,有的数据或许存在很强的相关性,当机器学习需要处理成千上万的数据时,机器学习的资源消耗是不可接受的,因此我们必须对数据进行降维,降维也意味着信息的丢失,不过鉴于实际数据本身常常存在的相关性,我们可以想办法在降维的同时将信息的损失尽量降低。PCA降维将尽可能减少信息的丢失,下面就PCA降维原理进行详细阐述。以下转自小马哥当然我并不打算...转载 2018-12-07 20:16:25 · 193 阅读 · 0 评论 -
最大似然估计
最大似然原理即是根据经验猜测最大可能性的结果。最大似然估计原理:极大似然估计是建立在极大似然原理的基础上的一个统计方法,是概率论在统计学中的应用。极大似然估计提供了一种给定观察数据来评估模型参数的方法,即:“模型已定,参数未知”。通过若干次试验,观察其结果,利用试验结果得到某个参数值能够使样本出现的概率为最大,则称为极大似然估计。即是利用已知的样本的结果,在使用某个模型的基础上,反推最有可能导...转载 2018-12-08 18:52:13 · 892 阅读 · 0 评论 -
logistic逻辑回归
1. 什么是逻辑回归?许多人对线性回归都比较熟悉,但知道逻辑回归的人可能就要少的多。从大的类别上来说,逻辑回归是一种有监督的统计学习方法,主要用于对样本进行分类。在线性回归模型中,输出一般是连续的,例如y=f(x)=ax+b y=f(x)=ax+b,对于每一个输入的x,都有一个对应的y输出。模型的定义域和值域都可以是[-∞, +∞]。但是对于逻辑回归,输入可以是连续的[-∞, +∞...转载 2018-12-12 18:19:15 · 187 阅读 · 0 评论 -
最小二乘
文章转自Excaliburer`s Zone先看下百度百科的介绍:最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟合。其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。 通过这段描述可以看出来,最小二乘...转载 2018-12-08 21:44:05 · 180 阅读 · 0 评论 -
梯度下降算法及dot()函数的理解
文章参考来源六尺帐篷,其中加入了一些自己的理解。本文将从一个下山的场景开始,先提出梯度下降算法的基本思想,进而从数学上解释梯度下降算法的原理,最后实现一个简单的梯度下降算法的实例!梯度下降的场景假设梯度下降法的基本思想可以类比为一个下山的过程。假设这样一个场景:一个人被困在山上,需要从山上下来(i.e. 找到山的最低点,也就是山谷)。但此时山上的浓雾很大,导致可视度很低。因此,...原创 2018-12-09 21:25:47 · 2004 阅读 · 1 评论