机器学习
文章平均质量分 58
程序员表哥鱼大
做一个学者,做一个实践家
展开
-
初学者的十大机器学习算法
本文翻译整理:https://www.dataquest.io/blog/top-10-machine-learning-algorithms-for-beginners/介绍在哈佛商业评论文章中称“数据科学家”为“21世纪最性感的工作”后,ML算法的研究获得了巨大的推动。因此,对于ML领域的初学者,我们决定重新启动我们广受欢迎的Gold博客10算法机器学习工程师需要知道- 尽管这篇文章针对...原创 2018-07-01 22:35:01 · 290 阅读 · 0 评论 -
强烈推荐deeplearning.ai 吴恩达给你的人工智能第一课(中文版)
我们都知道有一个地方,它的名字叫cursera.我们都知道有一个人,他的名字叫吴恩达。我们知道他曾是斯坦福的教授,后来他不干了,但他还一直在传播人工智能。他的斯坦福机器学习课程很火,他想造福更多的人,包括中国人,让更多的人开始学习人工智能,让学习变得easy!这是英文网站:https://www.deeplearning.ai/你试试!黝黑的界面,深邃,但深不可测,也许是因为这黑色,或者是这英文...原创 2018-07-01 22:49:05 · 1642 阅读 · 3 评论 -
机器学习不得不知的的特征工程
Feature engineering本文开始之前,着重强调“特征工程的重要性:数据决定算法的上限”。(图片与本文无关,好看点个赞?)何为特征工程特征使用方案1)要实现我们的目标需要哪些数据2)可行性评估:获取难度,覆盖率,准确率特征获取方案1)如何获取这些特征?2)如何存储,什么样的形式存储特征清洗1)特征清洗,异常样本的清晰2)采样数据均衡问题特征预处理1)对于单个特征:归一化,标准化,离散...原创 2018-07-01 22:18:30 · 677 阅读 · 1 评论 -
Windows下如何在Python上安装xgboost ?
一个正确的安装过程,敌得过花两小时试了那些所谓的正确方式!本文例子环境:python3.6 ,window10,anaconda刚开始试了conda install py-xgboost,建议赶紧停下,不想你遇到那么多坑!以下步骤,简单好用:1.先下载xgboost的.whl文件,地址:https://www.lfd.uci.edu/~gohlke/pythonlibs/#xgboost2.whl...原创 2018-07-01 22:31:36 · 3083 阅读 · 1 评论 -
机器学习中多分类问题解决思路
机器学习中如何应对多分类问题,一般我们只知道二分类问题比较好弄,很多算法在书上都是以二分类问题介绍原理。对于多分类的情况该怎么办呢?在这里我举一个有趣例子来阐述思路。案例:对于一个汽车的好坏评价,总共有四种评价:很好,好,一般,差。给了一些数据用来训练这些评价分类器,如何才能得到四种的评价呢。思路:首先,将这四种评价数值化表示:{很好:1,好:2,一般:3,差:4},对于 1,2,3,4 ,...原创 2018-07-01 22:16:40 · 10354 阅读 · 1 评论 -
机器学习为什么需要交叉验证?怎么使用k-fold cross validation(k-折叠交叉验证)
介绍这个非常重要的概念,希望在训练算法时能帮助各位。概念和思维解读叉验证的目的:在实际训练中,模型通常对训练数据好,但是对训练数据之外的数据拟合程度差。用于评价模型的泛化能力,从而进行模型选择。交叉验证的基本思想:把在某种意义下将原始数据(dataset)进行分组,一部分做为训练集(train set),另一部分做为验证集(validation set or test set),首先用训练集对模型...原创 2018-07-01 22:32:36 · 7784 阅读 · 0 评论