自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 偏差、方差对比

机器学习中,有两个很重要的工具,用于评价算法,并且可以反映出算法是泛化能力。这就是偏差和方法。1.偏差:期望输出与真实标记的区别计算上,就是 偏差^2 =(均值-正确值)^22.方差:输出对于均值的偏离程度计算上,就是 方差 = ((输出-均值)^2)的期望3.噪声:期望值(预测值)与真实值的差距计算上,就是 噪声^2 = ((...

2020-03-13 16:53:06 606

原创 kNN算法(k-临近算法)

kNN算法应该是一个最简单的分类算法首先,存在一个有标签的样本数据集,然后输入无标签数据,将新输入是数据对应的特征值进行比较,让背后算法提取样本集中特征最相似数据,即为最邻近的分类标签。一般我们取前k个最相似的数据,并且以其中出现次数最多的分类作为新数据的分类。算法中有三个基本因素:k值、距离度量、分类决策规则,在这个算法中,我们一般以欧式距离作为判别的度量方式。(内容来源于机器学习实战)...

2020-03-12 12:23:41 416

原创 机器学习----linear models和kernel models总结

最近看了台湾大学林轩田教授的《机器学习》相关课程,总结一下课程中讲解的linear models和kernel models,课程中总结的位置在《机器学习技巧》6-4(第六周,第四节)视频中的截图线性模型(linear models 的总结图)从图中可以看到我们在机器学习领域中熟知的线性模型。线性模型和Kernel模型总结图(linear/kernel models)从图中可以看到,...

2020-03-04 17:44:15 1443

原创 append方法和concat方法对比

放假看书有一些想法,写一下。a.append(b,ignore_index=True),追加,index顺序增加pandas.concat([a,b]) a,b合并,index不变import pandasfrom pandas import DataFramea = DataFrame({'math':[85,50,65],'chinese':[90,85,60]})b = Data...

2020-02-25 16:25:00 1178 1

原创 pandas.Series.rank()用法的理解

今天看了《基于python的大数据分析基础及实战》看到了pandas.Series.rank()默认情况下的结果注:pandas.Series.rank()把对象的value替换为数值等级(相应的名次)。import pandas as pdfrom pandas import Seriesser = Series([4,2,0,3],index=list('abcd'))ser.ran...

2020-02-25 16:03:54 1931

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除