机器学习
文章平均质量分 81
金戈拉斯
不忘初衷,方能始终!
展开
-
利用数据可视化技术来学习钻石鉴别
文章目录数据背景数据背景鸢尾花可以分成 Setosa、Versicolour 和 Virginica 三个品种,在这个数据集中,针对每一个品种,都有 50 个数据,共150条数据。每个数据中包括了 4 个属性,分别是花萼长度、花萼宽度、花瓣长度和花瓣宽度。...原创 2020-05-20 13:26:46 · 1752 阅读 · 0 评论 -
参数估计与假设检验的通俗理解
文章目录参数估计假设检验参数估计For 高手:参数估计(parameter estimation),统计推断的一种。根据从总体中抽取的随机样本来估计总体分布中未知参数的过程。从估计形式看,区分为点估计与区间估计:从构造估计量的方法讲,有矩法估计、最小二乘估计、似然估计、贝叶斯估计等。要处理两个问题:(1)求出未知参数的估计量;(2)在一定信度(可靠程度)下指出所求的估计量的精度。信度一般用概率表示,如可信程度为95%;精度用估计量与被估参数(或待估参数)之间的接近程度或误差来度量。For 小白:人原创 2020-05-19 22:58:09 · 2764 阅读 · 0 评论 -
核密度函数详解,核密度函数图如何看?
前言上一篇博客画了一张核密度函数,但是搜了半天也没找到怎么分析这个图。求人不如求自己,这篇来分析一下这个核密度函数和核密度图。说的不对的地方还请大神指出。概率密度从数学上看,分布函数F(x)=P(X<x),表示随机变量X的值小百于x的概率。这个意义很容易理解。概率密度f(x)是F(x)在x处的关于x的一阶导数,即变化率。如果在某一x附近取非常小的一个邻域Δx,那么,随机度变量X落在(x, x+Δx)内的概率约为f(x)Δx,即P(x<X<x+Δx)≈f(x)Δx。换句话说,概率原创 2020-05-19 22:56:51 · 37659 阅读 · 2 评论 -
Python 数据可视化,常用看这一篇就够了
文章目录前言可视化视图分为 4 类,散点图折线图直方图条形图箱线图饼图热力图蜘蛛图二元变量分布成对关系总结前言如果你想要用 Python 进行数据分析,就需要在项目初期开始进行探索性的数据分析,这样方便你对数据有一定的了解。其中最直观的就是采用数据可视化技术,这样,数据不仅一目了然,而且更容易被解读。可视化视图分为 4 类,比较:比较数据间各类别的关系,或者是它们随着时间的变化趋势,比如折线图;联系:查看两个或两个以上变量之间的关系,比如散点图;构成:每个部分占整体的百分比,或者是随着时间的百原创 2020-05-19 22:05:36 · 49016 阅读 · 9 评论 -
自然语言处理(NLP)-NLTK入门学习(三)
前面两篇已经基本上算是完成了预处理部分的分享了,这里开始分享一些文本处理。语言结构是非常复杂的,需要按照其不同的处理层次来对它进行描述。这里会分享常见的文本结构,介绍结构之间的区别和用法。同样我会试着通过代码的方式以实例展示其处理过程。概念:1. 为什么需要进行文本解析回答这个问题的时候可以先回想一下当初我们学习语言时是怎样的一个过程,首先我们先学一些单词,2. 两种解析方式:...原创 2018-06-24 12:02:24 · 1651 阅读 · 0 评论 -
个人机器学习笔记==》常见术语
基本术语:西瓜样例数据:ID色泽根蒂敲声酸甜程度销量1红色蜷缩浊响601002绿色蜷缩清脆801503红色硬挺清脆90300数据集:一组数据的集合,如:这里的3组数据。样本(示例):反映事件或者对象的某些方面的变现或性质的事项。如:这里每一行数据都是一个样本。属性(特征):这里的色泽,敲声都可以称为西瓜的属性或者特征。样本空间(属性空间):假设每一个属性都是被描述的对象的一个维度,那么多个属性或者...原创 2018-07-01 19:49:12 · 757 阅读 · 0 评论 -
个人机器学习笔记==》如何正确进行模型评估
误差:经验误差:在训练集样本中分类错误的样本占总训练样本集的比例,也称为训练误差泛化误差:在新样本上的误差比例。精度:1-错误率,精度为100%通常都是有问题的。过拟合:...原创 2018-07-02 22:41:54 · 452 阅读 · 0 评论 -
机器学习(三)——线性模型
过去的一周可以说是十分痛苦,一方面工作强度上来了,另一方面生活上遇到的麻烦事,感觉人生观都受到了冲击,本来说好的每周写两篇博客,这周一篇也没有写出来,这里自己做一个检讨!以后一定把那个女人给忘掉,继续开始我的屌丝生活。 这是我的第一篇用MarkDown写的博客,我会尽量用标准的格式去编写,希望它可以带来全新体验。 这里需要分享的是机器学习的线性模型,这应该是最简单的模型了,自己看了一遍还不是很...原创 2018-07-20 17:47:17 · 640 阅读 · 0 评论