机器学习
糖人豆丁
这个作者很懒,什么都没留下…
展开
-
机器学习实战——机器学习基础
机器学习用到了统计学知识机器学习就是把无序的数据转换成有用的信息如何从数据集中选取特征? 通常的做法是测量所有可测属性,而后再挑出重要部分。机器学习的主要任务就是分类。为了测试机器学习算法的效果,通常使用两套独立的样本集,训练数据和测试数据。当机器学习程序开始运行时,使用训练样本集作为算法的输入,训练完成后输入测试样本。输入测试样本时并不提供测试样本的目标变量,由程序决定样本属于那个类...翻译 2018-03-29 21:41:17 · 486 阅读 · 0 评论 -
PyTorch学习
莫烦Python的回归教程,有很多亮点值得学习,避免忘记,把代码贴一下# -*- coding: utf-8 -*-import torchfrom torch.autograd import Variableimport torch.nn.functional as Fimport matplotlib.pyplot as pltimport warningswarnings.fi...原创 2018-09-24 10:37:08 · 759 阅读 · 0 评论 -
Kaggle入门Titanic生存预测 v1.0.0
目录标题前言问题定义数据查看分析数据处理数据替换将数据导入模型中进行训练数据预处理模型训练测试集预测总结前言一直在学机器学习的理论知识,但是没有实践,还是感觉心里不踏实,Kaggle的入门比赛Titanic号生存预测是一个getting started competition,很适合入门,掌握机器学习的各种常见套路.这里刚开始也是参考其他代码做的,得分是0.78947,不是很高,由此可见,虽然...原创 2018-09-19 11:42:48 · 577 阅读 · 0 评论 -
AI学习笔记(一)
不同于之前常见的基于规则的硬编码所要处理的那种特定的任务,人工智能具有一定的通用性,可以处理更加复杂的计算任务,并具有一定的推理能力,这就是所谓的"通用人工智能"或"强人工智能"(General AI).目前的人工智能只是在某些特定任务上达到或超过了人类,但缺少一定的通用性,是一种弱人工智能(Narrow AI),非强人工智能. 2. ...原创 2018-09-08 18:23:10 · 1801 阅读 · 0 评论 -
关于机器学习、深度学习基础概念的一些理解
首先,根据问题的背景,需要选择合适的机器学习或深度学习算法去求解,也就是说需要训练出一个模型来,这个模型的实际训练过程是:当确定了机器学习模型后,需要在训练集上进行训练确定其中的权重和偏差参数(使用梯度下降算法最小化损失函数),使用训练数据集来训练模型的过程称作为模型拟合,确定的是参数;但实际还有一些超参数需要去确定,也就是模型选择(不同的超参数对应一个不同的模型),使用在训练数据集上得到的模型在...原创 2018-06-10 22:01:27 · 166 阅读 · 0 评论 -
机器学习元算法
元算法将不同的分类器组合起来,具体使用有多种形式,可以是不同算法的集成,也可以是不同算法在不同设置下的集成,还可以是数据集不同部分分配给不同分类器之后的集成。一、bagging:基于数据随机重抽样的分类器构建算法自举汇聚法(bootstrap aggregating),也称为bagging方法,是在从原始数据集选择S次后得到S个新数据集的一种技术。新书记集和原始数据集大小相等。每个数据集都...原创 2018-04-19 14:48:57 · 2048 阅读 · 0 评论 -
支持向量机SVM
一、简介SVM被有的人认为是目前最好的现成(现成是指分类器不加修改即可直接使用)的算法之一,这意味着在数据上应用基本形式的SVM分类器就可以得到低错误率的结果。SVM能对训练集之外的数据点做出很好的分类决策。二、概念解释分隔超平面:即分类的决策边界,分布在超平面一侧的所有数据都属于某个类别,而分布在另一侧的所有数据则属于另一个类别。构建分类器:数据点离决策边界越远,那么其最后的...原创 2018-04-17 22:11:39 · 160 阅读 · 0 评论 -
机器学习如何处理数据中的缺失值
处理数据缺失值的常见做法:使用可用特征的均值来填补缺失值使用特殊值来填补缺失值,如-1忽略有缺失值的样本使用相似样本的均值填补缺失值使用机器学习算法预测缺失值...原创 2018-04-17 16:07:26 · 1298 阅读 · 0 评论 -
机器学习分类器---决策树
一、决策树 经常使用决策树来处理分类问题,决策树也是最经常使用的数据挖掘算法,不需要了解机器学习的知识,就能搞明白决策树是如何工作的。 kNN算法可以完成很多分类任务,但它最大的缺点就是无法给出数据的内在含义,决策树的主要优势在于数据形式非常容易理解 决策树能够读取数据集合,其一个重要任务是为了数据中所蕴含的知识信息,因此决策树可以使用不熟悉的数据集合,并从中提取出一系列规则,...原创 2018-04-10 10:37:05 · 653 阅读 · 0 评论 -
numpy中的tile函数的使用说明
numpy中的tile函数网上讲解的有很多,但大概都是一带而过,这里参照官方文档进行一下说明。 def tile(A, reps): “”” Construct an array by repeating A the number of times given by reps. If reps has length d, the result wi...原创 2018-04-08 22:38:06 · 288 阅读 · 0 评论 -
机器学习实战之kNN算法
一、kNN算法基本概念 基本概念: kNN算法采用测量不同特征值之间的距离方法进行分类 kNN算法 a.优点:精度高、对异常值不敏感、无数据输入假定 b.缺点:计算复杂度高、空间复杂度高 c**.使用数据范围:数值型和标称型。(标称型:一般在有限的数据中取,而且只存在‘是’和‘否’两种不同的结果,一般用于分类;数值型:可以在无限的数据中取...原创 2018-04-07 22:01:36 · 339 阅读 · 0 评论 -
配置远程GPU服务器
实验室刚好有一台GPU服务器,假期想远程使用,就想能否试一下像Google的CoLab那样通过jupyter notebook进行访问,试了一下确实可以,这里记录一下过程。服务器和本地系统都是Ubuntu16.04一、Jupyter Notebook的配置Jupyter Notebook的安装有很多教程,这里只记录安装完之后如何进行配置使得通过客户端浏览器可以访问。为Jupyter No...原创 2019-02-12 10:17:21 · 4748 阅读 · 0 评论