自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Thinkgamer博客

处女作:推荐系统开发实战,公众号:搜索与推荐Wiki

  • 博客(15)
  • 资源 (19)
  • 收藏
  • 关注

原创 scikit-learn学习之神经网络算法

1:神经网络算法简介2:Backpropagation算法详细介绍3:非线性转化方程举例4:自己实现神经网络算法NeuralNetwork5:基于NeuralNetwork的XOR实例6:基于NeuralNetwork的手写数字识别实例7:scikit-learn中BernoulliRBM使用实例8:scikit-learn中的手写数字识别实例

2016-04-27 17:30:38 54008 7

原创 scikit-learn学习之贝叶斯分类算法

======================================================================本系列博客主要参考 Scikit-Learn 官方网站上的每一个算法进行,并进行部分翻译,如有错误,请大家指正转载请注明出处,谢谢=====================================================...

2016-04-26 21:48:46 39058

原创 《机器学习实战》基于信息论的三种决策树算法(ID3,C4.5,CART)

决策树是通过一系列规则对数据进行分类的过程,他提供一种在什么条件下会得到什么值的类似规则方法,决策树分为分类树和回归树,分类树对离散变量最决策树,回归树对连续变量做决策树如果不考虑效率等,那么样本所有特征的判断级联起来终会将某一个样本分到一个类终止块上。实际上,样本所有特征中有一些特征在分类时起到决定性作用,决策树的构造过程就是找到这些具有决定性作用的特征,根据其决定性程度来构造一个倒立的树–决定性作用最大的那个特征作为根节点,然后递归找到各分支下子数据集中次大的决定性特征,直至子数据集中所有数据都属于同一

2016-04-26 11:50:47 22149 2

原创 scikit-learn学习之K-means聚类算法与 Mini Batch K-Means算法

======================================================================本系列博客主要参考 Scikit-Learn 官方网站上的每一个算法进行,并进行部分翻译,如有错误,请大家指正 转载请注明出处========================================================...

2016-04-26 00:43:00 53102 5

原创 《机器学习实战》Logisic回归算法(2)之从疝气病症预测病马的死亡率

=====================================================================《机器学习实战》系列博客是博主阅读《机器学习实战》这本书的笔记也包含一些其他python实现的机器学习算法 算法实现均采用pythongithub 源码同...

2016-04-25 15:03:18 7152

原创 《机器学习实战》Logistic回归算法(1)

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer=================================================================《机器学习实战》系列博客是博主阅读《机器学习...

2016-04-25 00:13:44 21536 3

原创 scikit-learn学习之回归分析

======================================================================本系列博客主要参考 Scikit-Learn 官方网站上的每一个算法进行,并进行部分翻译,如有错误,请大家指正 ===============================================================...

2016-04-24 16:47:58 20431

原创 scikit-learn学习之K最近邻算法(KNN)

======================================================================本系列博客主要参考 Scikit-Learn 官方网站上的每一个算法进行,并进行部分翻译,如有错误,请大家指正 =====================================================================...

2016-04-24 11:19:03 48617 23

翻译 HBase 数据库检索性能优化策略

HBase 数据库是一个基于分布式的、面向列的、主要用于非结构化数据存储用途的开源数据库。其设计思路来源于 Google 的非开源数据库”BigTable”。HDFS 为 HBase 提供底层存储支持,MapReduce 为其提供计算能力,ZooKeeper 为其提供协调服务和 failover(失效转移的备份操作)机制。Pig 和 Hive 为 HBase 提供了高层语言支持,使其可以...

2016-04-24 09:34:49 3604

转载 深入 HBase 架构解析(2)

前言这是《深入HBase架构解析(1)》的续,不多废话,继续。。。。 HBase读的实现通过前文的描述,我们知道在HBase写时,相同Cell(RowKey/ColumnFamily/Column相同)并不保证在一起,甚至删除一个Cell也只是写入一个新的Cell,它含有Delete标记,而不一定将一个Cell真正删除了,因而这就引起了一个问题,如何实现读的问题?要

2016-04-23 22:57:41 1997

转载 深入 HBase 架构解析(1)

前记公司内部使用的是MapR版本的Hadoop生态系统,因而从MapR的官网看到了这篇文文章:An In-Depth Look at the HBase Architecture,原本想翻译全文,然而如果翻译就需要各种咬文嚼字,太麻烦,因而本文大部分使用了自己的语言,并且加入了其他资源的参考理解以及本人自己读源码时对其的理解,属于半翻译、半原创吧。HBase架构组成HBase采

2016-04-23 22:55:13 2545

原创 scikit-learn学习之决策树算法

======================================================================本系列博客主要参考 Scikit-Learn 官方网站上的每一个算法进行,并进行部分翻译,如有错误,请大家指正 ===================================================================...

2016-04-23 20:44:38 21917 18

原创 几种常见的中文分词包的分析与比较

1:中文分词简介2:Lucence的中文分词3:庖丁分词简介4:IK中文分词简介一:中文分词简介 1:分词算法分类 -----基于字符串匹配的中文分词方法 eg:句子:我来自沈阳航空航天大学 词典:沈阳 航空 航天 大学 沈阳航空航天大学 ...

2016-04-17 09:59:30 6176

翻译 《推荐系统学习》之推荐系统那点事

转载自:http://www.admin10000.com/document/4995.html推荐系统的误区  回想起来,我也算是国内接触推荐系统较早的人之一了,最近和人聊天,觉得不少人对推荐系统有所误解,以为需要多么高大上的算法才能搭建起来的,我只想说我经常说的那句话【不是这样的】,所以有了这篇文章。  第一次接触【推荐系统】是在两年前在某高校的互联网信息处理实验室的时候,那时...

2016-04-17 08:15:50 5829 7

原创 MySQL学习笔记之多表连接

多表连接分为:1、内连接 2、外连接(左外连接和右外连接)先看看内连接的使用方法:有两个表:a:b:执行内连接操作:select a.id,a.name,a.pro,b.sex from a join b on a.bid=b.id;结果显示如下此时修改a表中最后一条数据对应的bid=4update a set bid=4 whe...

2016-04-01 22:15:40 2057

grafana-6.3.3-1 rpm安装包.zip

grafana-6.3.3-1.x86_64.rpm 安装包,

2020-04-09

word2vec.zip

word2vec 官方资源未修改版和malloc函数替换版,官方源码 需要科学上网才能获取,这里进行提供,同时mac os系统下需要修改malloc函数方可使用,这里也提供一份修改后的

2019-11-13

NLP汉语自然语言处理原理与实战

自然语言处理大体是从1950年代开始,虽然更早期也有作为。1950年,图灵发表论文“计算机器与智能”,提出现在所谓的“图灵测试”作为判断智能的条件。 1954年的乔治城实验涉及全部自动翻译超过60句俄文成为英文。研究人员声称三到五年之内即可解决机器翻译的问题。[1]不过实际进展远低于预期,1966年的ALPAC报告发现十年研究未达预期目标,机器翻译的研究经费遭到大幅削减。一直到1980年代末期,统计机器翻译系统发展出来,机器翻译的研究才得以更上一层楼。 1960年代发展特别成功的NLP系统包括SHRDLU——一个词汇设限、运作于受限如“积木世界”的一种自然语言系统,以及1964-1966年约瑟夫·维森鲍姆模拟“个人中心治疗”而设计的ELIZA——几乎未运用人类思想和感情的讯息,有时候却能呈现令人讶异地类似人之间的互动。“病人”提出的问题超出ELIZA 极小的知识范围之时,可能会得到空泛的回答。例如问题是“我的头痛”,回答是“为什么说你头痛?

2018-06-15

一种人脸表情分类的新方法_Manhattan距离

一种人脸表情分类的新方法_Manhattan距离_李俊华.pdf

2017-07-15

gephi-0.9.1-windows.exe

2017-02-14

mysql-connector-java-5.0.4-bin.jar

2017-02-14

commons-el-1.0.jar,jasper-compiler.jar,jasper-runtime.jar

commons-el-1.0.jar,jasper-compiler.jar,jasper-runtime.jar

2016-07-28

delicious.dat

经过预处理的。数据格式 [ USER_ID , URL_ID , Tags ] 。

2016-06-16

kosarak.dat

FP_Tree算法构建新闻点击流的数据集

2016-05-09

从疝气病症预测病马的死亡率的测试数据集

2016-04-25

从疝气病症预测病马的死亡率的训练数据集

从疝气病症预测病马的死亡率的训练数据集,机器学习实战第五章logistic回归实例数据

2016-04-25

hadoop-eclipse-plugin-2.6.0.jar

hadoop-eclipse-plugin-2.6.0.jar

2015-08-02

lucene4.3.0+IK Analyzer2012FF

lucene4.3.0+IK Analyzer2012FF

2015-07-31

IKAnalyzer_all_jar

IKAnalyzer_all_jar,适用于中文分词(Java和mapreduce)

2015-07-31

十大算法之线性查找算法

算法步骤: 1. 将n个元素每5个一组,分成n/5(上界)组。 2. 取出每一组的中位数,任意排序方法,比如插入排序。 3. 递归的调用selection算法查找上一步中所有中位数的中位数,设为x,偶数个中位数的情况下设定为选取中间小的一个。 4. 用x来分割数组,设小于等于x的个数为k,大于x的个数即为n-k。 5. 若i==k,返回x;若ik,在大于x的元素中递归查找第i-k小的元素。 终止条件:n=1时,返回的即是i小元素。

2015-07-29

高精度的加减乘除

高精度对于初学者来说并不是容易的,所以小编在这里这里整理了高精度的加减乘除运算,在一个程序中实现,希望对各位童鞋有所帮助

2014-08-23

securboot未完全配置消除补丁

在我们新安装windows系统后在桌面右下角会出现securboot未完全配置消除补丁这些字,若在BIOS中设置的话对电脑某些功能有影响(如电脑装有双系统,另一个系统进不去,或者电脑不能正常开机),此时就需要这样一个补丁来解决这个问题

2014-08-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除