刘玉刚--AI-技术研究院

Liu Yugang -------AI-Technology Research Institute

[机器学习]机器学习资源大全中文版

机器学习资源大全中文版 我想很多程序员应该记得 GitHub 上有一个 Awesome - XXX 系列的资源整理。awesome-machine-learning 就是 josephmisiti 发起维护的机器学习资源列表,内容包括了机器学习领域的框架、库以及软件(按编程语言排序)。 Awe...

2018-05-27 21:10:04

阅读数:527

评论数:0

[机器学习]机器学习笔记07—模型的评估与选择

一 名词解释 训练误差:模型在训练集上的误差. 泛化误差:新样本在学模型上的误差 泛化能力: 指机器学习算法对新样本的适应能力 二 模型选择与评估方法 通常为了选择适当的模型,我们需要对该模型进行评估,可以使用实验测试对模型的泛化误差进行比较,因此,需要测试...

2018-05-21 08:57:18

阅读数:305

评论数:0

[机器学习]机器学习笔记06—术语解释

术语解释 数据集(data set): 所有记录的集合 实例或样本: 每一条记录 属性或特征: 例如,西瓜的色泽等称之为一个属性 特征向量: 一条记录,如果在坐标轴上表示,每个西瓜都可以用坐标轴中的一个点表示,一个点也是一个向量,例如(青绿,蜷缩,浊响),即每个西瓜即为一个特征向量 维数: 一...

2018-05-20 15:43:23

阅读数:289

评论数:0

[机器学习]机器学习笔记05—欠拟合与过拟合

1、过拟合概念 1) 过拟合在生活中一个自负可以理解为过拟合; 2) 在机器学习中就是训练出来的模型在训练集上表现很好,但是在测试集上表现较差的一种现象!下图给出例子: 我们将上图第三个模型解释为出现了过拟合现象,过度的拟合了训练数据,而没有考虑到泛化能力。在训练集上的准确率和在...

2018-05-19 13:15:16

阅读数:304

评论数:0

[机器学习]Scikit-Learn学习笔记04—线性回归之最小二乘法

基础概念 线性回归是很常见的一种回归,线性回归可以用来预测或者分类,主要解决线性问题。 线性回归过程主要解决的就是如何通过样本来获取最佳的拟合线。最常用的方法便是最小二乘法,它是一种数学优化技术,它通过最小化误差的平方和寻找数据的最佳函数匹配。 “最小二乘法”的核心就是保证所有数据偏差的平方和...

2018-05-17 23:47:21

阅读数:186

评论数:0

[机器学习]Scikit-Learn学习笔记03——Scikit-Learn数据模型

Scikit-Learn提供了比较全的数据集,主要分为以下几类 1. 自带的小数据集(packaged dataset) 2. 在线下载的数据集(Downloaded Dataset) 3. 生成的数据集(Generated Dataset) 4. svmlight/libsvm格式的数据集...

2018-05-17 12:34:42

阅读数:347

评论数:0

[机器学习]Scikit-Learn学习笔记02——Scikit-Learn学习方法

Scikit-Learn把所有的机器学习算法都整合在一起了,根据需要选取相应的学习算法. Scikit-Learn通用的学习步骤: 1.数据 2.根据数据特点选取相对应的算法 3.建立模型 3.预测数据 1.数据 scikit-learn 内置有一些小型标准数...

2018-05-17 12:32:54

阅读数:141

评论数:0

[机器学习]Scikit-Learn学习笔记01——Scikit-Learn基础概念

概念 1.sklearn是一个Python第三方提供的非常强力的机器学习库 2.scikit-learn是一个基于NumPy,SciPy,Matplotlib的开源学习工具包 3. 在数据量不是过大的情况下,可以解决大部分问题. 安装 安装 Scikit-learn (sklearn) ...

2018-05-13 17:41:45

阅读数:604

评论数:0

提示
确定要删除当前文章?