机器学习
TechLess
这个作者很懒,什么都没留下…
展开
-
机器学习--KNN算法应用,iris鸢尾花数据集的分类
数据集介绍 Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含150个数据样本,分为3类,每类50个数据,每个数据包含4个属性。可通过 花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类. 用CNN分类Iris数据集 from sklearn.datasets import load_ir...原创 2019-07-09 13:10:02 · 4889 阅读 · 0 评论 -
机器学习--数据的标准化常用方法
数据标准化的意义 许多机器学习建模前,如果特征看起来一点都不符合标准正态分布的话,训练得到的模型可能会很糟糕。 标准化在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。 min-max标准化 也称为离散标准化,是对原始数据的线性变换,将数据值映射到[0, 1]之间。 Z-score标准化 x:观测值 x_:总...原创 2019-07-09 14:38:45 · 1386 阅读 · 0 评论 -
机器学习--SVM支持向量机
import numpy as np import matplotlib.pyplot as plt from sklearn.datasets import load_iris iris = load_iris() X = iris.data y = iris.target X = X[y<2, :2] # 取两个特征,二分类 y = y[y<2] from sklearn.m...原创 2019-07-13 15:24:30 · 101 阅读 · 0 评论 -
机器学习--朴素贝叶斯算法
Sklearn提供三种朴素贝叶斯模型 from sklearn.naive_bayes import GaussianNB, BernoulliNB, MultinomialNB 模型名称 中文释义 数据分布 特征特点 GaussianNB 高斯朴素贝叶斯模型 连续式数据 特征的数据是连续的,比如人的身高从1.7~1.9之间可以用曲线图表示 BernoulliNB 伯努利朴...原创 2019-07-11 12:24:40 · 140 阅读 · 0 评论 -
机器学习--K-Means算法应用
import matplotlib.pyplot as plt from sklearn.datasets.samples_generator import make_blobs # 聚类数据测试工具 # 在sklearn中,随机生成1000个样本,每个样本2个特征,共4个簇,簇中心在[-1, -1], [0, 0], [1, 1], [2, 2],簇方差分别为[0.3,0.1,0.4,0.2] ...原创 2019-07-12 11:36:21 · 213 阅读 · 0 评论 -
机器学习--KNN算法(K-近邻)
KNN算法 简称:K近邻算法 英文全称:K-Nearest Neighbors Algorithm 属于监督学习 中心思想:找到未分类的测试样本,附近K个最相近的已分类的样本,该样本的分类,由附近已分类的样本投票决定 如何计算测试样本与y已分类样本之间的距离 欧氏距离:相当于两点间距离 曼哈顿距离:相当于X+Y 如何选择K值 K为经验值 通常K取奇数 一般情况下K∈(1,√n) 当n较少...原创 2019-07-17 22:51:29 · 401 阅读 · 0 评论