博客专栏  >  编程语言   >  数据挖掘基础算法

数据挖掘基础算法

数据挖掘是机器学习的基础,这里分享些数据挖掘的基础算法,仅做入门使用,望能给大家带来更多的想法、、、

关注
3 已关注
18篇博文
  • DBSCAN 具有噪声的基于密度的聚类算法简述 附Python代码

    DBSCAN  DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)是一种很典型的密度...

    2017-07-21 15:46
    453
  • Tensorflow 入门一 (安装配置,会话控制,变量常量,传入值)

    Tensorflow: TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统,主要是深度神经网络模型。 也是一时兴起开始学习这玩意,走到哪,博客写到哪里,全当记录。 ...

    2016-10-26 09:41
    2258
  • 激励函数简介 Tensorflow最简单的三层神经网络及matplotlib可视化 附激励函数常见类型

    激励函数: 有人说翻译成“激活函数”(activation function)会更好,因为主要作用是分割数据,判断该“神经”是否被激活。比如说,当你判断面前的动物是否是一只猫的时候,你会从各个部分去...

    2016-10-31 02:39
    4211
  • Tensorflow 自带可视化Tensorboard使用方法 附项目代码

    Tensorboard: 如何更直观的观察数据在神经网络中的变化,或是已经构建的神经网络的结构。上一篇文章说到,可以使用matplotlib第三方可视化,来进行一定程度上的可视化。然而Tensorfl...

    2016-11-02 09:57
    41858
  • Tensorflow MNIST机器学习入门 分类学习

    MNIST: MNIST是一个很出名的手写数字数据库,据说是美国中学生手写的数字,包含28*28的图片和与之对应的Tag。我们的目标就是使用Tensorflow来对MNIST的数据进行处理,已达到自...

    2016-11-03 11:28
    534
  • Tensorflow Overfitting过拟合解决方法 Dropput()使用方法

    Overfitting过拟合 所谓过拟合,就是指把学习进行的太彻底,把样本数据的所有特征几乎都习得了,于是机器学到了过多的局部特征,过多的由于噪声带来的假特征,造成模型的“泛化性”和识别正确率几乎达...

    2016-11-10 02:39
    2400
  • TensorFlow不同版本引起的错误

    最近有开始搞点Tensorflow,但是突然发现以前有点API没用了,特此转载,用来记录,方便回忆。 转自:http://blog.csdn.net/s_sunnyy/article/details...

    2017-07-07 16:48
    494
  • 频繁模式和关联规则原理与简述

    频繁模式和关联规则: “啤酒与尿布”故事: 这是一个几乎被举烂的例子,“啤酒与尿布”的故事产生于20世纪90年代的美国沃尔玛超市中,沃尔玛的超市管理人员分析销售数据时发现了一个令人难于理解的现象:在某...

    2016-10-13 09:14
    1188
  • 决策树 (Decision Tree) 原理简述及相关算法(ID3,C4.5)

    Decision Tree 决策树: 决策树是属于机器学习监督学习分类算法中比较简单的一种,决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路...

    2016-11-11 04:11
    1896
  • K-Nearest Neighbor(KNN) 最邻近分类算法及Python实现方式

    K-Nearest Neighbor 最邻近分类算法: 简称KNN,最简单的机器学习算法之一,核心思想俗称“随大流”。是一种分类算法,基于实例的学习(instance-based learning)...

    2016-11-12 05:40
    1391
  • 决策树 (Decision Tree) 进阶应用 CART剪枝方法及Python实现方式

    决策树  Decision Tree C5.0 先简述下C5.0,C5.0是一个商业软件,对于公众是不可得到的。它是在C4.5算法做了一些改进。比之C45,减少了内存,使用更少的规则集,并且准确率...

    2016-11-16 03:48
    3600
  • SVM 基本概念及Python实现方式

    SVM(support vector machine)支持向量机: 注意:本文不准备提到数学证明的过程,一是因为有一篇非常好的文章解释的非常好:http://blog.csdn.net/v_july_...

    2016-11-16 09:55
    1921
  • 基于NaiveBayse SVM KNN的Python垃圾短信过滤系统 附代码

    垃圾短信过滤系统 一个课程的结课设计,挺好玩的。 数据处理: 短信数据来源于UCI machine learning repository,可以到以下网址去下载:https://archive....

    2016-12-12 18:01
    978
  • 基于NaiveBayse SVM KNN的Python垃圾短信过滤系统(二)

    Update V2.0 增大了数据量,从80条数据,60训练数据,20测试数据,到160条数据,120训练数据,40测试数据。因为数据源原因,160条数据之后不是GBK编码,无法识别,因此最多160条...

    2016-12-18 13:02
    549
  • 基于ARIMA的股票预测 Python实现 附Github

    ARIMA 全称为自回归积分滑动平均模型(Autoregressive Integrated Moving Average Model,简记ARIMA)。核心函数是ARIMA(p,d,q)称为差分自回...

    2016-12-23 04:51
    3821
  • 基于SVM的股票预测 Python实现 附Github

    SVM 支持向量机 原理就不赘述了,其余的文章有讲过。SVM是一种十分优秀的分类算法,使用SVM也能给股票进行一定程度上的预测。 核心 因为是分类算法,因此不像ARIMA一样预测的是时序...

    2016-12-30 21:32
    7369
  • K-means、K-means ++、K-modes和K-prototype聚类算法简述 附Python代码

    K-means K-means属于聚类算法中最简单的一种,也是一种无监督学习的算法。 步骤: 按上图所示,具体步骤如下: 1. 设定初始簇的个数,上图为2 2. 使用欧式距离对簇进行分类,...

    2017-07-07 16:25
    915
  • 卡方检验的原理作用以及Python、R语言的实现方式

    卡方检验(chi-square test) 或称X^2检验,主要作用是判定实际统计数据是否符合期望值,之后便可以演变出各种用法,例如:特征选择,变量各类的出现概率,变量是否相互有关联等。 主要公...

    2016-10-07 08:40
    6818
img博客搬家
img撰写博客
img发布 Chat
img专家申请
img意见反馈
img返回顶部