scikit-learn学习之神经网络算法

1:神经网络算法简介 2:Backpropagation算法详细介绍 3:非线性转化方程举例 4:自己实现神经网络算法NeuralNetwork 5:基于NeuralNetwork的XOR实例 6:基于NeuralNetwork的手写数字识别实例 7:scikit-learn中BernoulliRBM使用实例 8:scikit-learn中的手写数字识别实例...
阅读(13949) 评论(5)

scikit-learn学习之贝叶斯分类算法

====================================================================== 本系列博客主要参考 Scikit-Learn 官方网站上的每一个算法进行,并进行部分翻译,如有错误,请大家指正  转载请注明出处,谢谢   ==================================================...
阅读(7713) 评论(0)

《机器学习实战》基于信息论的三种决策树算法(ID3,C4.5,CART)

决策树是通过一系列规则对数据进行分类的过程,他提供一种在什么条件下会得到什么值的类似规则方法,决策树分为分类树和回归树,分类树对离散变量最决策树,回归树对连续变量做决策树如果不考虑效率等,那么样本所有特征的判断级联起来终会将某一个样本分到一个类终止块上。实际上,样本所有特征中有一些特征在分类时起到决定性作用,决策树的构造过程就是找到这些具有决定性作用的特征,根据其决定性程度来构造一个倒立的树–决定性作用最大的那个特征作为根节点,然后递归找到各分支下子数据集中次大的决定性特征,直至子数据集中所有数据都属于同一...
阅读(4443) 评论(0)

scikit-learn学习之K-means聚类算法与 Mini Batch K-Means算法

====================================================================== 本系列博客主要参考 Scikit-Learn 官方网站上的每一个算法进行,并进行部分翻译,如有错误,请大家指正    转载请注明出处 ===========================================================...
阅读(16464) 评论(0)

《机器学习实战》Logisic回归算法(2)之从疝气病症预测病马的死亡率

============================================================================================ 《机器学习实战》系列博客是博主阅读《机器学习实战》这本书的笔记,包含对其中算法的理解和算法的Python代码实现 另外博主这里有机器学习实战这本书的所有算法源代码和算法所用到的源文件,有需要的留言 =...
阅读(2124) 评论(0)

[置顶] 《机器学习实战》Logistic回归算法(1)

============================================================================================ 《机器学习实战》系列博客是博主阅读《机器学习实战》这本书的笔记,包含对其中算法的理解和算法的Python代码实现 另外博主这里有机器学习实战这本书的所有算法源代码和算法所用到的源文件,有需要的留言 =...
阅读(8448) 评论(1)

scikit-learn学习之回归分析

本篇博客主要介绍了简单线性回归,多元线性回归和非线性回归,主要是结合Python和Scikit-learn机器学习库进行相应的分析 目录: 1、概念 2、简单线性回归(Simple Liner Regession) 3、多元性回归(Mutiple Regession) 4、非线性回归(Logistic Regession)...
阅读(9735) 评论(0)

scikit-learn学习之K最近邻算法(KNN)

kNN算法全称是k-最近邻算法(K-Nearest Neighbor) kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。...
阅读(7588) 评论(12)

HBase 数据库检索性能优化策略

HBase 数据库是一个基于分布式的、面向列的、主要用于非结构化数据存储用途的开源数据库。其设计思路来源于 Google 的非开源数据库”BigTable”。 HDFS 为 HBase 提供底层存储支持,MapReduce 为其提供计算能力,ZooKeeper 为其提供协调服务和 failover(失效转移的备份操作)机制。Pig 和 Hive 为 HBase 提供了高层语言支持,使其可以进...
阅读(1514) 评论(0)

深入 HBase 架构解析(2)

前言 这是《深入HBase架构解析(1)》的续,不多废话,继续。。。。   HBase读的实现 通过前文的描述,我们知道在HBase写时,相同Cell(RowKey/ColumnFamily/Column相同)并不保证在一起,甚至删除一个Cell也只是写入一个新的Cell,它含有Delete标记,而不一定将一个Cell真正删除了,因而这就引起了一个问题,如何实现读的问题?要...
阅读(818) 评论(0)

深入 HBase 架构解析(1)

前记 公司内部使用的是MapR版本的Hadoop生态系统,因而从MapR的官网看到了这篇文文章:An In-Depth Look at the HBase Architecture,原本想翻译全文,然而如果翻译就需要各种咬文嚼字,太麻烦,因而本文大部分使用了自己的语言,并且加入了其他资源的参考理解以及本人自己读源码时对其的理解,属于半翻译、半原创吧。 HBase架构组成 HBase采...
阅读(1061) 评论(0)

scikit-learn学习之决策树算法

决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出,若欲有复数输出,可以建立独立的决策树以处理不同输出。 数据挖掘中决策树是一种经常要用到的技术,可以用于分析数据,同样也可以用来作预测 基本思想 1)树以代表训练样本的单个结点开始。 2)如果样本都在同一个类.则该结点成为树叶,并用该类标记。...
阅读(7082) 评论(8)

几种常见的中文分词包的分析与比较

1:中文分词简介 2:Lucence的中文分词 3:庖丁分词简介 4:IK中文分词简介 一:中文分词简介     1:分词算法分类         -----基于字符串匹配的中文分词方法                eg:句子:我来自沈阳航空航天大学                        词典:沈阳  航空  航天  大学  沈阳航空航天大学...
阅读(1426) 评论(0)

《推荐系统学习》之推荐系统那点事

转载自:http://www.admin10000.com/document/4995.html 推荐系统的误区   回想起来,我也算是国内接触推荐系统较早的人之一了,最近和人聊天,觉得不少人对推荐系统有所误解,以为需要多么高大上的算法才能搭建起来的,我只想说我经常说的那句话【不是这样的】,所以有了这篇文章。   第一次接触【推荐系统】是在两年前在某高校的互联网信息处...
阅读(1715) 评论(1)

MySQL学习笔记之多表连接

多表连接分为: 1、内连接        2、外连接(左外连接和右外连接) 先看看内连接的使用方法: 有两个表: a: b: 执行内连接操作:  select a.id,a.name,a.pro,b.sex from a join b on a.bid=b.id; 结果显示如下 此时修改a表中最后一条数据对应的bid=4 update a set bid=4 whe...
阅读(793) 评论(0)
    Thinkgamer微博
    个人微信,一起交流!

     扫一扫,关注我




    个人资料
    • 访问:629811次
    • 积分:8313
    • 等级:
    • 排名:第2280名
    • 原创:208篇
    • 转载:24篇
    • 译文:2篇
    • 评论:211条
    个人简介
    姓名:Thinkgamer

    Github:https://github.com/thinkgamer

    主攻:云计算/python/数据分析

    程度:熟悉/熟悉/熟悉

    微信:gyt13342445911

    Email:thinkgamer@163.com

    工作状态:在职ing

    心灵鸡汤:只要努力,你就是下一个大牛...

    hadoop/spark/机器学习群:279807394(大神建的群,蹭个管理员)

    欢迎骚扰........
    博客专栏
    最新评论