![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 92
bxg1065283526
希望现在开始为时不晚,努力一定会有收货
展开
-
First Steps with TensorFlow
1.First Steps with TensorFlow: Toolkit下图是TensorFlow工具包的结构层次图: 下表总结了不同层的用途:工具包说明Estimator (tf.estimator)高级 OOP API。tf.layers/tf.losses/tf.metrics用于常见模型组件的库。TensorFlow低级 APITens...原创 2018-03-22 20:13:23 · 283 阅读 · 0 评论 -
1.机器学习sklearn-------聚类
1.sklearn简介Scikit learn 也简称 sklearn, 是机器学习领域当中最知名的 python 模块之一.sklearn库共分为6大部分,分别用于完成分类任务、回归任务、聚类任务、降维任务、模型选择以及数据的预处理2.模块加载其中分类任务:回归任务:聚类任务:降维任务:3.聚类任务聚类(clustering)就是根据数据的相似性,将数据分为多类的过程。而相似性的定义一般用距离在...原创 2018-04-20 00:07:45 · 5504 阅读 · 1 评论 -
10.机器学习sklearn-------手写数字识别实例
1.概念介绍:图像识别(Image Recognition)是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。 图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。机器学习领域一般将此类识别问题转化为分类问题。手写识别是常见的图像识别任务。计算机通过手写体图片来识别出图片中的字,与印刷字体不同的是,不同人的手写体风格迥异,大小不一, 造成了计算机对手...原创 2018-04-24 00:04:07 · 28927 阅读 · 4 评论 -
9.机器学习sklearn-----岭回归及其应用实例
1.基本概念对于一般地线性回归问题,参数的求解采用的是最小二乘法,其目标函数如下:参数w的求解,也可以使用如下矩阵方法进行: 对于矩阵X,若某些列线性相关性较大(即训练样本中某些属性线性相关),就会导致,就会导致XTX的值接近0,在计算(XTX)-1时就会出现不稳定性: 结论:传统的基于最小二乘的线性回归法缺乏稳定性。岭回归(ridge regression)是一种专用于共线性数据分析...原创 2018-04-22 21:48:11 · 8395 阅读 · 3 评论 -
8.机器学习sklearn---多项式回归(房价与房屋尺寸关系的非线性拟合)
1.基本概念多项式回归(Polynomial Regression)是研究一个因变量与一个或多个自变量间多项式的回归分析方法。如果自变量只有一个 时,称为一元多项式回归;如果自变量有多个时,称为多元多项式回归。 1.在一元回归分析中,如果依变量y与自变量x的关系为非线性的,但是又找不到适当的函数曲线来拟合,则可以采用一元多项式回归。 2.多项式回归的最大优点就是可以通过增加x的高次...原创 2018-04-22 21:43:55 · 18617 阅读 · 0 评论 -
7.机器学习sklearn-------线性回归(房价与房屋尺寸关系的线性拟合)
1.基本概念线性回归(Linear Regression)是利用数理统计中回归分析, 来确定两种或两种以上变量间相互依赖的定量关系的一种统计分 析方法。 线性回归利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模。这种函数是一个或多个称为回 归系数的模型参数的线性组合。只有一个自变量的情况称为简单 回归,大于一个自变量情况的叫做多元回归。2.用途线性回归有很多实际的用途,...原创 2018-04-22 21:01:52 · 6030 阅读 · 0 评论 -
5.机器学习sklearn-----分类实例运动状态
1.背景介绍• 可穿戴式设备的流行,让我们可以更便利地使用传感器获取人体的各项数据, 甚至生理数据。• 当传感器采集到大量数据后,我们就可以通过对数据进行分析和建模,通过 各项特征的数值进行用户状态的判断,根据用户所处的状态提供给用户更加 精准、便利的服务。2.数据介绍收集了来自 A,B,C,D,E 5位用户的可穿戴设备上的传感器数据, 每位用户的数据集包含一个特征文件(a.feature)和一个...原创 2018-04-22 20:29:30 · 1152 阅读 · 2 评论 -
6.机器学习sklearn------上证指数涨跌预测
1.数据介绍:网易财经上获得的上证指数的历史数据,爬取了20年的上证指数数据。2. 实验目的: 根据给出当前时间前150天的历史数据,预测当天上证指数的涨跌。3.数据实例:中核科技1997年到2017年的股票数据部分截图,红框部分为选取的特征值数据实例4.实验过程: 数据格式#用来加载CSV数据的工具包import pandas as pd#:支持高级大量的维度数组与矩阵运算,此外也针对数组运...原创 2018-04-22 20:07:26 · 7382 阅读 · 2 评论 -
4.sklearn机器学习-------分类(监督学习)
1.监督学习利用一组带有标签的数据,学习从输入到输出的映射,然后将这种映射 关系应用到未知数据上,达到分类或回归的目的。 分类:当输出是离散的,学习任务为分类任务。 回归:当输出是连续的,学习任务为回归任务。2.分类学习输入:一组有标签的训练数据(也称观察和评估),标签表明了这些数 据(观察)的所署类别。输出:...原创 2018-04-22 12:32:33 · 3053 阅读 · 1 评论 -
3.机器学习sklearn-----基于聚类的图像分割
1.概念介绍图像分割:利用图像的灰度、颜色、纹理、形状等特征,把图像分成若 干个互不重叠的区域,并使这些特征在同一区域内呈现相似性,在不同的区 域之间存在明显的差异性。然后就可以将分割的图像中具有独特性质的区域 提取出来用于不同的研究。图像分割技术已在实际生活中得到广泛的应用。例如:在机车检验领域, 可以应用到轮毂裂纹图像的分割,及时发现裂纹,保证行车安全;在生物医 学工程方面,对肝脏CT图像进行...原创 2018-04-21 23:37:53 · 17236 阅读 · 5 评论 -
训练集和测试集 (Training and Test Sets):拆分数据
将数据集分为两个子集:训练集 - 用于训练模型的子集。测试集 - 用于测试训练后模型的子集。如果只有一个数据集的话,可以将数据集分开:图 1. 将单个数据集拆分为一个训练集和一个测试集。但要确保测试集满足以下两个条件:规模足够大,可产生具有统计意义的结果。能代表整个数据集。换言之,挑选的测试集的特征应该与训练集的特征相同。假设测试集满足上述两个条件,目标是创建一个能够很好地泛化到新数据的模型。我们...原创 2018-04-16 22:56:04 · 41482 阅读 · 0 评论 -
泛化 (Generalization):过拟合的风险
假设这些图中的每个点代表一棵树在森林中的位置。图中的两种颜色分别代表以下含义:蓝点代表生病的树。橙点代表健康的树。 图 1. 生病(蓝色)和健康(橙色)的树。如果我们很严格的区分,如图二所示: ...原创 2018-04-15 23:31:31 · 1306 阅读 · 0 评论 -
TensorFlow使用的基本步骤-----以线性回归为例
1.设置TensorFlow拥有非常丰富的库,第一步首先加载需要的库import mathfrom IPython import displayfrom matplotlib import cmfrom matplotlib import gridspecfrom matplotlib import pyplot as pltimport numpy as npimport pand...原创 2018-04-15 21:45:39 · 842 阅读 · 0 评论 -
Pandas简介
本文根据Google机器学习平台学习内容整理得。1.Pandas介绍:pandas是一种列存数据分析 API。它是用于处理和分析输入数据的强大工具,很多机器学习框架都支持将pandas*数据结构作为输入。2.基本概念 ①首先导入pandas包,查看其版本import pandas as pdpd._version_ ②pandas 中的主要数据结构被实现为以下两类: DataFra...原创 2018-04-14 21:51:22 · 523 阅读 · 0 评论 -
3.Reducing Loss(减少误差)
1.machine learning model iteratively(迭代) reduces loss通过输入特征值,通过模型预测,然后与标签比较,计算出误差,更新相关参数,重新进行预测,直至找到最佳参数(即误差最小)。上图即展示了机器学习算法如何训练模型。迭代策略在机器学习中十分普遍,对于大量数据集的测量表现良好。对于以下线性回归模型,输入一个或多个特征值,输出一个预测值y',为了简化,我们...原创 2018-03-21 16:50:56 · 370 阅读 · 0 评论 -
机器学习术语表 中英
A A/B 测试 (A/B testing) 一种统计方法,用于将两种或多种技术进行比较,通常是将当前采用的技术与新技术进行比较。A/B测试不仅旨在确定哪种技术的效果更好,而且还有助于了解相应差异是否具有显著的统计意义。A/B 测试通常是采用一种衡量方式对两种技术进行比较,但也适用于任意有限数量的技术和衡量方式。 准确率 (accuracy) 分类模型的正确预测所占的比例。在多类别分类中,...原创 2018-03-20 22:37:44 · 629 阅读 · 0 评论 -
Linear Regression
1.Descending into ML: Linear Regression(深入学习线性回归)As a birthday gift, Aunt Ruth gives you her beloved cricket database and invites you to learn a model to predict this relationship for yourself.(通过一个蟋蟀...原创 2018-03-19 22:19:47 · 217 阅读 · 0 评论 -
机器学习的基本术语
一.Key ML Terminology(1) Label(标签)A label the thing we're predicting-the y variable in simple linear regression. 是我们想要预测的简单线性回归的y变量(2)Features(特征值)A feature is an input variable describing our data—the...原创 2018-03-19 16:18:25 · 523 阅读 · 0 评论 -
2机器学习sklearn-----降维
1.降维介绍保证数据所具有的代表性特性或分布的情况下,将高维数据转化为低维数据。聚类和分类都是无监督学习的典型任务,任务之间存在关联,比如某些高维数据的分类可以通过降维处理更好的获得。降维过程可以被理解为数据集的组成成分进行分解(decomposition)的过程,因此sklearn为降维模块命名为decomposition。在对降维算法调用需要使用sklearn.decomposition模块2...原创 2018-04-21 16:57:53 · 2640 阅读 · 0 评论