机器学习
a776995799
这个作者很懒,什么都没留下…
展开
-
《机器学习》读书笔记----序言
1. 一些概念 独立同分布:随机过程中,任何时刻的取值都为随机变量,如果这些随机变量服从同一分布,并且互相独立,那么这些随机变量是独立同分布2.深度学习 复杂度更高的算法,主要适合于神经网络3.数学在机器学习上的应用 主要是概率统计;代数是基础工具,如矩阵理论和特征值理论,微分方程求解归结为代数问题 微分几何应用在流形学习,微分方程应用在归纳学习...原创 2018-08-27 23:03:57 · 423 阅读 · 0 评论 -
Ubuntu 16.04 安装tensorflow
环境:win7系统+VMware+Ubuntu16.04_64位安装tensorflow cpu版本(先安装cpu版本,用来简单练习,后面有需要,再安装gpu版本) 先说说遇到的问题,首先试图在Ubuntu14.04上安装,但可能是默认的pip版本低,出现很多错误。最终选择了在ubuntu16.04 上安装。 安装步骤1:安装pip打开终端,输入命令:sudo...原创 2019-03-01 19:28:14 · 225 阅读 · 0 评论 -
matplotlib画图,标题用中文时乱码
问题: 绘图后想加中文标题,出现乱码 plt.title(u"中文标题")原因:缺少中文字体解决: 下载字体:可以去http://www.font5.com.cn/zitixiazai/1/151.html下载一种字体,我下载的是simhei,解压,把解压出的simhei.ttf文件放到C:\Windows\Fonts文件夹下 ...原创 2019-02-14 15:31:47 · 1218 阅读 · 0 评论 -
kaggle初探
传说kaggle是一个提供了机器学习比赛的地方,作为一个初学者,也想去看一看。于是搜索了一些kaggle入门的文章,决定从提供了指导的泰坦尼克预测下手。Titanic: Machine Learning from Disaster https://www.kaggle.com/c/titanic/data一、首先看看概述(overview),需要我们干什么。1.1描述 “I...原创 2019-02-21 21:34:29 · 1215 阅读 · 0 评论 -
说说我眼中的机器学习--初学者的随想
作为一名机器学习的初学者,浅谈一下我眼中的机器学习,欢迎大家批评指正。一、为什么需要机器学习? 计算机的本质是在计算,那计算机如何实现推理呢?人类的大脑是如何推理的?我们在判断一件事时,会根据以往经验,但在做出判断时,到底是哪些经验起了决定性作用呢?恐怕我们自己也不知道。但我们又希望能根据已有的东西,去推断未知的东西。此时,我们需要一个黑盒子,一端把已有的扔进去,让黑盒子...原创 2019-02-18 20:53:17 · 428 阅读 · 0 评论 -
学习《机器学习100天》第25天 随机森林
github上的项目,跟着一起学习项目地址 https://github.com/MLEveryday/100-Days-Of-ML-Code随机森林:有监督 集成学习模型(建立很多决策树,再集成) 主要用于分类和回归随机森林与决策树的区别:随机森林中,查找根节点和分割特征节点的过程是随机进行的。决策树的构建方式: 1. 随机选取数据:训练集N个样本,有放回...原创 2019-02-22 15:52:56 · 264 阅读 · 0 评论 -
matplotlib画多个子图时重叠
问题: matplotlib画多个子图时重叠解决:fig.tight_layout()加在绘图后 使用fig.tight_layout(pad=?,w_pad=?, h_pad=?),调整绘图的间距和大小。 参数: pad:设置绘图区边缘与画布边缘的距离 w_pad:设置绘图区之间的水平...原创 2019-02-14 16:53:50 · 7398 阅读 · 0 评论 -
学习《机器学习100天》第9天 支持向量机(SVM)
github上的项目,跟着一起学习直观了解SVM是什么以及如何使用它来解决分类问题。(1)什么是SVM?SVM(Support Vector Machine):支持向量机(2)SVM是用来干什么的?找到一个超平面,用来解决分类问题。最大化支持向量到超平面的距离。根据问题是否线性可分,又用到了核函数 参考:SVM理解 https://blog.csdn.net...原创 2019-01-28 19:46:50 · 189 阅读 · 2 评论 -
学习《机器学习100天》第一天 数据预处理
github上的项目,跟着一起学习数据预处理 | 第1天用来练习的数据是这样的:Country Age Salary Purchased France 44 72000 No Spain 27 48000 Yes Germany 30 54000 No Spain 38 61000 ...原创 2019-01-07 22:56:12 · 227 阅读 · 0 评论 -
学习《机器学习100天》第4天 逻辑回归
逻辑回归的基础理论知识与上一节的线性回归区别:逻辑回归输出结果是离散的,线性回归输出结果是连续的。如判断邮件是否为垃圾邮件。假设首先使用线性回归的方法,得到的输出可能为任意值。想要实现逻辑回归,需要把输出变到0到1之间,所以用到sigmoid函数函数图像:输出总在0到1之间。逻辑回归的输出是离散值,如果是二分类,只有0和1两个状态,为了把sigmoid变换后的0到1之间...原创 2019-01-11 20:01:41 · 221 阅读 · 0 评论 -
名词解释
1、TF-IDF(term frequency–inverse document frequency):一种用于信息检索与数据挖掘的常用加权技术。TF意思是词频(Term Frequency),IDF意思是逆文本频率指数(Inverse Document Frequency)。用途:评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增...原创 2019-01-17 13:54:13 · 609 阅读 · 0 评论 -
一些评价标准
分类问题:准确率回归问题:1、RMSE(Root Mean Square Error):均方根误差,观测值与真值偏差的平方与观测次数n比值的平方根m:样本个数y:真实输出值^y:预测得到的输出值i:第i个样本2、MAE(Mean Absolute Error ):平均绝对误差,又叫平均绝对离差,是所有单个观测值与算术平均值的偏差的绝对值的平均3、MSE(me...原创 2019-01-17 13:16:17 · 236 阅读 · 0 评论 -
什么是先验概率和后验概率?
假设迟到的原因有2个: 1.天气不好 2.起床晚了先验概率:迟到的概率条件概率:已知天气不好的条件下,迟到的概率后验概率:已经迟到了,因为天气原因迟到的概率 参考:https://blog.csdn.net/Mr_HHH/article/details/83346428...原创 2019-01-04 19:56:44 · 13841 阅读 · 2 评论 -
notebook运行报错No module named 'pydotplus'
代码:import pydotplus报错:ModuleNotFoundError: No module named 'pydotplus'环境:windows+anaconda-notebook解决:打开anaconda prompt命令行,conda install pydotplus参考:https://blog.csdn.net/qq_35550465/article/...原创 2019-01-04 13:53:22 · 11325 阅读 · 3 评论 -
《机器学习》读书笔记--第1章 绪论
1.1引言机器学习定义:研究如何通过计算的手段,利用经验(数据)改善系统的性能。 在计算机上从数据中产生模型的算法,即学习算法。 假设用P评估计算机程序在某任务类T上的性能,程序利用经验E,在T上改善了P1.2基本术语数据集:记录的集合属性/特征:事件或对象在某方面的表现或性质的事项属性值:属性的取值属性空间/样本...原创 2018-09-05 17:08:46 · 202 阅读 · 0 评论 -
学习《机器学习100天》第32天 深入研究 | NUMPY
github上的项目,跟着一起学习项目地址 https://github.com/MLEveryday/100-Days-Of-ML-Code得到JK VanderPlas写的书《Python数据科学手册(Python Data Science HandBook)》,Jupyter notebooks在这里。(https://github.com/jakevdp/PythonData...原创 2019-03-03 16:57:39 · 216 阅读 · 0 评论