机器学习
TechLess
这个作者很懒,什么都没留下…
展开
-
机器学习--KNN算法应用,iris鸢尾花数据集的分类
数据集介绍Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含150个数据样本,分为3类,每类50个数据,每个数据包含4个属性。可通过 花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类.用CNN分类Iris数据集from sklearn.datasets import load_ir...原创 2019-07-09 13:10:02 · 4897 阅读 · 0 评论 -
机器学习--数据的标准化常用方法
数据标准化的意义许多机器学习建模前,如果特征看起来一点都不符合标准正态分布的话,训练得到的模型可能会很糟糕。标准化在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。min-max标准化也称为离散标准化,是对原始数据的线性变换,将数据值映射到[0, 1]之间。Z-score标准化x:观测值x_:总...原创 2019-07-09 14:38:45 · 1395 阅读 · 0 评论 -
机器学习--SVM支持向量机
import numpy as npimport matplotlib.pyplot as pltfrom sklearn.datasets import load_irisiris = load_iris()X = iris.datay = iris.targetX = X[y<2, :2] # 取两个特征,二分类y = y[y<2]from sklearn.m...原创 2019-07-13 15:24:30 · 102 阅读 · 0 评论 -
机器学习--朴素贝叶斯算法
Sklearn提供三种朴素贝叶斯模型from sklearn.naive_bayes import GaussianNB, BernoulliNB, MultinomialNB 模型名称中文释义数据分布特征特点GaussianNB高斯朴素贝叶斯模型连续式数据特征的数据是连续的,比如人的身高从1.7~1.9之间可以用曲线图表示BernoulliNB伯努利朴...原创 2019-07-11 12:24:40 · 142 阅读 · 0 评论 -
机器学习--K-Means算法应用
import matplotlib.pyplot as pltfrom sklearn.datasets.samples_generator import make_blobs # 聚类数据测试工具# 在sklearn中,随机生成1000个样本,每个样本2个特征,共4个簇,簇中心在[-1, -1], [0, 0], [1, 1], [2, 2],簇方差分别为[0.3,0.1,0.4,0.2]...原创 2019-07-12 11:36:21 · 218 阅读 · 0 评论 -
机器学习--KNN算法(K-近邻)
KNN算法简称:K近邻算法英文全称:K-Nearest Neighbors Algorithm属于监督学习中心思想:找到未分类的测试样本,附近K个最相近的已分类的样本,该样本的分类,由附近已分类的样本投票决定如何计算测试样本与y已分类样本之间的距离欧氏距离:相当于两点间距离曼哈顿距离:相当于X+Y如何选择K值K为经验值通常K取奇数一般情况下K∈(1,√n)当n较少...原创 2019-07-17 22:51:29 · 402 阅读 · 0 评论