机器学习
文章平均质量分 78
夏绿
非我无酒,以敖以游
展开
-
数据分析与展示(3)-- Matplotlib库基础使用
Matplotlib库的使用一、用图表达数据Matplotlib.pyplot绘制图形的命令子库,相当于快捷方式。1、列表画图,并保存import matplotlib.pyplot as pltplt.plot([3, 1, 4, 2, 5])plt.ylabel("grade")plt.savefig('test', dpi=60原创 2017-08-31 11:23:18 · 866 阅读 · 0 评论 -
数据提取(2):pandas库入门
Pandas库http://pandas.pydata.orgPandas是Python第三方库,提供高性能易用数据类型和分析工具。import pandas as pd数据类型:Series, DataFrame基于数据类型的各类操作:基本操作、运算操作、特征类操作、关联类操作Numpy: 基础数据类型:ndarray;原创 2017-08-31 10:59:03 · 387 阅读 · 0 评论 -
Anaconda IDE的基本使用
Anaconda来自于conda :一个包管理和环境管理工具 包管理和pip类似,管理Python第三方库环境管理能够允许用户使用不同版本Python,并能灵活转换。anaconda包括:一个集合,包括conda、某版本Python、一批第三方库等。一、安装下载:https://www.continuum.io/镜像下载地址:htttps://m原创 2017-08-31 11:58:17 · 4108 阅读 · 0 评论 -
数据降维、PCA——基于鸢尾花数据集
主成分分析PCA主成分分析(Principal Component Analysis, PCA)主成分:可以把具有相关性的高纬度变量,合成为线性无关的低纬度变量,称为主成分。主成分能够尽可能保留原始数据的信息。方差(度量分散程度)协方差(度量两变量间的线性相关性,0,线性无关)特征向量:描述数据结构的非零向量。原理:矩阵的主成分就是其协方差矩阵对原创 2017-08-31 13:57:26 · 9602 阅读 · 0 评论 -
K-means、图像分割
K-means聚类算法原理 k-means算法以k为参数,吧n个对象分成k个簇,使簇内具有较高的相似度,而簇间的相似度较低。随机选k个点作为初始的聚类中心。对剩下的点,根据距离,将其归入最近的簇。对每个簇,计算所有点的均值作为新的聚类中心。重复前两步,直到中心不再改变。参数:class sklearn.cluster.KMeans(n_clusters=8,in原创 2017-08-31 14:21:46 · 3451 阅读 · 0 评论 -
数据降维笔记——非负矩阵分解(NMF),人脸数据特征提取
数据降维——非负矩阵分解(NMF)Non-negative Matrix Factorization,实在矩阵中所有元素均为非负数约束条件之下的矩阵分解方法。NMF能够广泛应用于图像分析、文本挖掘和语音处理等领域。基本思想:给定一个非负矩阵V, NMF能够找到一个非负矩阵W和一个非负矩阵H,使得矩阵W和H的乘积近似等于矩阵V中的值。W矩阵:基原创 2017-09-21 15:32:42 · 6919 阅读 · 0 评论