自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 LDA(主题模型)简介

LDA(主题模型)1、 基本概念LDA(Latent Dirichlet Allocation)是一种文档主题生成模型。LDA的作用是判断两个文档的相似度,传统的方法使用词共现来判断,例如TF-IDF等,但这种方法未考虑文档的语义结构。LDA模型根据文档中的主题分布来判断文档的相似度。给定一个文档,首先分析出文档中包含哪些主题,然后判断不同文档中各个主题出现的概率大小。 例如下面两句话:

2017-08-29 21:00:07 3505 1

原创 全连接神经网络

基本概念:人工神经网络是根据生物神经网络构造的一种数据模型,每一层包含大量神经元。每两层神经元间的连接都存在一个初始参数,这个参数用来衡量神经元间相连接的重要程度。神经网络的每一层都具有多个节点,每个节点都与下层的所有节点相连,并且每一层的输出可以作为下一层的输入,每层神经网络中的节点只与其上一层和下一层的节点相连。 图1 神经网络结构BP(Back Propagation)神经网络:它是

2017-07-05 15:31:44 1306 1

原创 基于梯度上升算法的Logistic回归

基本概念:Logisitc回归用来解决二分类问题,训练数据为f(x,y),x为特征,y为类别。它的假设函数为Sigmoid函数,Sigmoid函数具体定义为: Sigmoid函数图像: 图1 Sigmoid函数从图像中可看出该函数的值大于0小于1,在分类问题中若大于0.5,则属于类1,若小于0.5则属于类0。Sigmoid函数的输入X为: 其中的[x_0,x_1,x_2

2017-07-04 19:44:35 508 2

原创 朴素贝叶斯过滤垃圾邮件

邮件数据下载地址:http://download.csdn.net/detail/liyuefeilong/9106481 具体代码如下:# -*- coding: utf-8 -*-"""Created on Tue Sep 08 16:12:55 2015@author: Administrator"""from numpy import *# 创建实验样本,可能需要对真实样本做一些处理

2017-07-04 16:31:41 1075 2

原创 决策树(decision tree)简介

基本概念:决策树用来解决分类问题,一棵树包含一个根结点,多个内部结点和多个叶子结点。未知数据从树的根结点开始判断,一直到叶子结点得到分类结果。本文主要关注决策树的构造方法。决策树算法是一种根据数据属性的泛化能力大小来进行分类的方法。其中属性的泛化能力大小由信息增益和信息增益率来评估。具体步骤:1.信息熵定义: 2.信息增益定义: 属性的信息增益越大表明属性的泛化能力越强。 3.增益率定

2017-07-03 20:38:38 555 3

原创 支持向量机(SVM)简介

本文主要参考于http://www.cnblogs.com/steven-yang/p/5658362.html基本概念:支持向量机(Support Vector Machine,SVM)是一种解决二元分类问题的方法。它根据实验数据中的部分数据来确定分类器,这些部分数据叫做支持向量。“机”是指分类器。接下来通过实例更加直观的理解支持向量机。

2017-07-03 10:15:54 2776 7

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除