![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
weixin_43579079
这个作者很懒,什么都没留下…
展开
-
随机森林代码
1.描述鸢尾花判断2.代码1.Iris_DecisionTree.py#!/usr/bin/python# -*- coding:utf-8 -*-import numpy as npimport matplotlib.pyplot as pltimport matplotlib as mplfrom sklearn import treefrom sklearn.tree ...原创 2019-08-30 16:35:07 · 1934 阅读 · 0 评论 -
朴素贝叶斯
1.介绍文本分类实验http://qwone.com/~jason/20Newsgroups/下载数据2.代码鸢尾花Iris_GaussianNB.py#!/usr/bin/python# -*- coding:utf-8 -*-import numpy as npimport matplotlib.pyplot as pltimport matplotlib as mpl...原创 2019-09-08 20:43:51 · 230 阅读 · 0 评论 -
非监督学习-GM(M)的EM算法
1.概念2.代码EM.py# !/usr/bin/python# -*- coding:utf-8 -*-import numpy as npfrom scipy.stats import multivariate_normal #多元正太分布from sklearn.mixture import GaussianMixture #高斯混合模型0.18from mpl_toolk...原创 2019-09-05 19:02:22 · 754 阅读 · 0 评论 -
非监督学习之聚类
1.概念2.代码kMeans.py# !/usr/bin/python# -*- coding:utf-8 -*-import numpy as npimport matplotlib.pyplot as pltimport sklearn.datasets as dsimport matplotlib.colorsfrom sklearn.cluster import KMe...原创 2019-09-05 16:09:10 · 195 阅读 · 0 评论 -
支持向量机SVM
1.概念2.代码鸢尾花SVM.Intro.py#!/usr/bin/python# -*- coding:utf-8 -*-import numpy as npfrom sklearn import svmfrom sklearn.model_selection import train_test_splitimport matplotlib as mplimport mat...原创 2019-09-03 21:23:35 · 270 阅读 · 0 评论 -
关于提升---XGBoost
1.提升提升是一个机器学习技术,可以用于回归和分类问题,每一步产生一个弱预测模型,并加权累加到总模型中;如果每一步的弱预测模型生成都是依据损失函数的梯度方向,则称之为梯度提升。提升的理论意义:如果一个问题存在弱分类器,则可以通过提升的办法得到强分类器。2.提升算法当平方和作为目标值时,将样本求均值,作为初始最优解。当绝对值作为目标时,中位数是最小最优解。(中位数就是大小排序在中间的数)...原创 2019-09-02 21:56:20 · 282 阅读 · 0 评论 -
回归问题
1.内容鸢尾花分类识别2.代码Adveritising.py#!/usr/bin/python# -*- coding:utf-8 -*-import csvimport numpy as npimport matplotlib.pyplot as pltimport pandas as pdfrom sklearn.model_selection import train_...原创 2019-08-30 21:06:25 · 128 阅读 · 0 评论 -
K-means 聚类方法
1.K-means聚类方法介绍数据挖掘十大经典算法之一算法接受参数k;然后将样本划分为k个聚类;同一聚类中的样本相似度较高;不同聚类中的样本相似度较小算法思想:以空间中k个样本点为中心进行聚类,对最靠近它们的样本点归类。通过迭代的方法,逐步更新各聚类中心,直至达到最好的聚类效果。算法过程:1.选择k个聚类的初始中心2.在第n次迭代中,对任意一个样本点,求其到k个聚类中心的距离,将该样...原创 2019-08-08 11:49:41 · 370 阅读 · 1 评论 -
项目:朴素贝叶斯手工模型
1.分类预测模型:朴素贝叶斯构建分类器的简单方法,不是训练分类器的单一算法,而是一系列基于相同原理的算法。假定样本每个特征与其他特征都不相关,即样本所包含的属性在判定其是否为某一类时的概率分布上是独立的(条件概率)。优点:学习和预测的效率高,易于实现;在数据较少时仍然有效,可以处理多分类问题。缺点:分类的效果不一定高,特征独立性假设使该模型简单,但是会牺牲一定的分类准确率。p(C∣F1,...原创 2019-08-13 00:37:48 · 140 阅读 · 0 评论 -
Logistic Reggression
1.关于逻辑1.概率定义:对一件事情发生可能性的衡量范围:0-1条件概率:在一件事已经发生非概率下,求另一件事发生的概率。依赖于条件发生的概率。2.线性回归得到的是线性关系,用线性表达式表达3.基本模型训练样本为 X(x1x_1x1, x2x_2x2, x3x_3x3, …, xnx_nxn)学习的参数为 W (w1w_1w1, w2w_2w2, w3w_3w3, ...原创 2019-08-08 23:04:55 · 181 阅读 · 0 评论 -
机器学习概念补充
1.过拟合和欠拟合1.1过拟合:在调试统计模型的时候,使用了过多的参数,模型对于训练数据拟合上程度过当。在训练数据上表现很好,但在测试集上表现不好。解决方法:使用交叉验证,增加样本数,改变超参数(设置范围进行循环)1.2欠拟合模型在训练和预测时表现都不好的情况;欠拟合很容易被发现。2.交叉验证及参数调整验证曲线sklearn.model_selection.validation...原创 2019-08-16 02:03:43 · 84 阅读 · 0 评论 -
主题模型
1.主题模型1.1先验分布-共轭分布1.2Bate分布-Dirichlet分布1.3三层贝叶斯网络模型LDA(LDA的应用方向:信息提取和搜索;文档分类/聚类、文章摘要、社区挖掘;基于内容的图像聚类、目标识别;生物信息数据的应用)(朴素贝叶斯的分析:可以胜任许多文本分类问题;无法解决语料中一词多义和多词一意的问题;可以通过增加“”主题“”的个数)1.4Gibbs采...原创 2019-09-09 19:49:27 · 122 阅读 · 0 评论