自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

bs的专栏

每天进步一点

  • 博客(6)
  • 收藏
  • 关注

原创 机器学习:过拟合与欠拟合问题

本文首发于AI柠檬博客,原文链接:机器学习:过拟合与欠拟合问题 | AI柠檬过拟合(overfitting)与欠拟合(underfitting)是统计学中的一组现象。过拟合是在统计模型中,由于使用的参数过多而导致模型对观测数据(训练数据)过度拟合,以至于用该模型来预测其他测试样本输出的时候与实际输出或者期望值相差很大的现象,。欠拟合则刚好相反,是由于统计模型使用的参数过少,以至于得到的模型难以拟合观测数据(训练数据)的现象。我们总是希望在机器学习训练时,机器学习模型能在新样本上很好的表现。过拟合时.

2022-03-14 22:38:10 3179

原创 统计N元语言模型生成算法:简单中文词频统计(文末获取代码)

本文首发于 AI柠檬博客,原文链接:统计N元语言模型生成算法:简单中文词频统计 | AI柠檬做自然语言处理有一个基本的步骤是词频统计,然而我们知道,中文的词语有单音节词、双音节词和多音节词之分,所以中文处理起来远比英文复杂得多。不过,我们可以“偷个懒”,如果要做词频统计的文本量足够大,而且我们只需要知道词频最高的几个词的话,那么我们可以将问题简化一下。我们简化成什么样呢?很简单,我们通过大量文本来分别每2字词、3字词、4字词乃至5个及以上的字词做一个切分,每统计一个后再向后偏移1字符,如此往复,直到

2022-03-14 22:26:18 530

原创 在数据为王的人工智能时代如何收集机器学习数据

文本首发于AI柠檬博客,原文链接:https://blog.ailemon.net/2017/02/17/how-to-collect-data-for-machine-learning/我最近因为学习机器学习并且想要做一些实践项目而打算收集一些数据来做机器学习,但是发现,数据不是你想找,想找就能找的。在机器学习方面,用于训练的数据对于整个机器学习进程的重要意义自然不言而喻,而数据问题涉及到收集、存储、表示以及规模和错误率等多个方面。关于数据,我想谈一谈数据的收集问题。如何收集数据呢?我们绝大.

2021-02-19 21:10:54 1083

原创 机器学习:对数几率回归(附代码)

对数几率回归(Logistic Regression),简称为对率回归,也称逻辑斯蒂回归,或者逻辑回归。虽然它被很多人称为逻辑回归,但是中文的“逻辑”一词与“logistic”和“logit”意思相去甚远。它是广义的线性模型,只是将线性回归方程中的y换成了ln[p/(1-p),p是p(y=1|x),p/(1-p)是“几率”。对数几率回归是用来做分类任务的,所以,需要找一个单调可微函数,将分类任务的真实标记和线性回归模型的预测值联系起来。一元对率回归既然是做0和1的二分类,我们肯定会想到“单位阶跃函数”

2021-02-19 21:01:21 2932

原创 机器学习:统计回归模型,文末可获取代码

文本首发于AI柠檬博客,原文链接:https://blog.ailemon.me/2017/02/10/machine-learningregression-statistic-model/统计回归方法是当今大多数机器学习方法的基础之一,机器学习的很多工程领域应用都是基于此的推广。在统计学中,线性回归(Linear regression)是利用称为线性回归方程的最小二乘函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。多项式曲线拟合(Fitting)则是将线性回归推广到了高阶函数中。机器学习

2020-11-06 22:10:19 494

原创 什么是机器学习?用最简单的话语告诉你,文末可获取代码

本文首发于AI柠檬博客,原文链接:https://blog.ailemon.net/2017/02/02/introduction-to-machine-learning/作为一个学习机器学习有一段时间的人,很理解那些还一点都不知道机器学习为何物的人的着急,因为我当时就是那样,我想以自己的语言来尽量通俗易懂地把它讲出来,以便帮助他们入门。文末可获取样例代码,可以自己动手直接运行学习。 机器学习是人工智能的一个分支,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科,已广泛应...

2020-11-06 21:33:28 300

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除