机器学习
dsjdjsa
这个作者很懒,什么都没留下…
展开
-
K-means聚类算法
K-means聚类算法k-means 算法以 k 为参数,把 n 个对象分成 k 个簇,使簇内具有较高的相似度,而簇间的相似度较低。其处理过程如下:1.随机选择k个点作为初始的聚类中心; 2.对于剩下的点,根据其与聚类中心的距离,将其归入最近的簇 3.对每个簇,计算所有点的均值作为新的聚类中心 4.重复2、3直到聚类中心不再发生改变K-means 聚类算法的应用数据介绍:现有1999年全国3原创 2017-05-25 18:28:25 · 1314 阅读 · 0 评论 -
用 线性回归 预测股票的涨跌
1、数据介绍网易财经上获得的上证指数的历史数据,爬取了20年的上证指数数据2、实验目的根据给出当前时间前150天的历史数据,预测当天上证指数的涨跌代码:import pandas as pdimport numpy as npfrom sklearn import svmfrom sklearn import cross_validationdata=pd.read_csv('000777.c原创 2017-07-22 16:45:14 · 12250 阅读 · 11 评论 -
“手写识别”实例介绍
图像识别: 图像识别(Image Recognition)是指利用计算机对图像进行处理、分析 和理解,以识别各种不同模式的目标和对像的技术。 图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体 识别。机器学习领域一般将此类识别问题转化为分类问题。手写识别: 手写识别是常见的图像识别任务。计算机通过手写体图片来识别出图片 中的字,与印刷字体不同的是,不同人的手写体风格迥异,大小原创 2017-05-29 20:25:10 · 5598 阅读 · 1 评论 -
用 sklearn 线性回归 拟合房价与房屋尺寸关系
线性回归: 线性回归(Linear Regression)是利用数理统计中回归分析, 来确定两种或两种以上变量间相互依赖的定量关系的一种统计分 析方法。 线性回归利用称为线性回归方程的最小平方函数对一个或多个自 变量和因变量之间关系进行建模。这种函数是一个或多个称为回 归系数的模型参数的线性组合。只有一个自变量的情况称为简单 回归,大于一个自变量情况的叫做多元回归。线性回归:使用形如y=wTx+原创 2017-05-28 09:15:55 · 2140 阅读 · 1 评论 -
人体运动状态预测-实例分析
背景介绍 : • 可穿戴式设备的流行,让我们可以更便利地使用传感器获取人体的各项数据, 甚至生理数据。• 当传感器采集到大量数据后,我们就可以通过对数据进行分析和建模,通过 各项特征的数值进行用户状态的判断,根据用户所处的状态提供给用户更加 精准、便利的服务。数据介绍:• 我们现在收集了来自 A, B, C, D, E 5 位用户的可穿戴设备上的传感器数据, 每位用户的数据集包含一个特征文件 (a原创 2017-05-27 16:10:12 · 7449 阅读 · 3 评论 -
监督学习
监督学习的目标利用一组带有标签的数据,学习从输入到输出的映射,然后将这种映射 关系应用到未知数据上,达到分类或回归的目的。分类:当输出是离散的,学习任务为分类任务。回归:当输出是连续的,学习任务为回归任务。分类学习:输入 : 一组有标签的训练数据(也称观察和评估),标签表明了这些数 据(观察)的所署类别。输出 : 分类模型根据这些训练数据,训练自己的模型参数,学习出一个 适合这组数据的分类器,当有原创 2017-05-27 11:54:51 · 576 阅读 · 0 评论 -
基于聚类的“图像分割”实例编写
基于聚类的“图像分割”实例编写图像分割 :利用图像的灰度、颜色、纹理、形状等特征,把图像分成若干个互不重叠的区域,并使这些特征在同一区域内呈现相似性,在不同的区 域之间存在明显的差异性。然后就可以将分割的图像中具有独特性质的区域提取出来用于不同的研究。图像分割技术已在实际生活中得到广泛的应用例如:在机车检验领域, 可以应用到轮毂裂纹图像的分割,及时发现裂纹,保证行车安全;在生物医 学工程方面,对肝脏原创 2017-05-26 20:24:19 · 5001 阅读 · 0 评论 -
NMF 方法及其实例
非负矩阵分解(Non-negative Matrix Factorization ,NMF) 是在矩阵中所有元素均为非负数约束条件之下的矩阵分解方法。基本思想:给定一个非负矩阵V,NMF能够找到一个非负矩阵W和一个 非负矩阵H,使得矩阵W和H的乘积近似等于矩阵V中的值。非负矩阵分解NMF人脸数据特征提取:代码:#!/usr/bin/env python3# -*- coding: utf-8 -*原创 2017-05-26 17:32:13 · 3303 阅读 · 0 评论 -
PCA 方法及其应用
** 主成分分析(Principal Component Analysis,PCA )是最常用的 一种降维方法,通常用于高维数据集的探索与可视化,还可以用作数 据压缩和预处理等。 PCA可以把具有相关性的高维变量合成为线性无关的低维变量,称为 主成分。主成分能够尽可能保留原始数据的信息。**主成分分析原理:算法过程:代码:In [28]: import matplotlib.pyplot as原创 2017-05-26 12:32:13 · 749 阅读 · 0 评论 -
DBSCAN 密度聚类
DBSCAN 密度聚类DBSCAN算法是一种基于密度的聚类算法: • 聚类的时候不需要预先指定簇的个数• 最终的簇的个数不定DBSCAN算法将数据点分为三类:• 核心点:在半径Eps内含有超过MinPts数目的点• 边界点:在半径Eps内点的数量小于MinPts,但是落在核心点的邻域内• 噪音点:既不是核心点也不是边界点的点DBSCAN算法流程:1.将所有点标记为核心点、边界点或噪声点;原创 2017-05-25 21:48:59 · 2278 阅读 · 0 评论 -
用 岭回归 预测交通流量
1、数据介绍数据为某路口的交通流量监测数据,记录全年小时级别的车流量。2、实验目的根据已有的数据创建多项式特征,使用岭回归模型代替一般的线性模型,对 车流量的信息进行多项式回归。3、代码import numpy as npimport pandas as pdfrom sklearn import cross_validationfrom sklearn.linear_model import原创 2017-07-22 20:11:36 · 6145 阅读 · 13 评论