自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

云杉的博客

我的愿望是 世界和平

  • 博客(16)
  • 资源 (3)
  • 收藏
  • 关注

原创 项目总结文章

项目总结

2017-03-20 09:40:21 895

原创 如何在centos下更改默认版本的python

问题:centos6.5安装了一anaconda和anaconda3两个版本, 这两个版本的python版本也不一样,一个是python2.7.10,一个是python3.5.2那么如何使环境默认为python2.7.10呢?经查看,发现这两个版本的anaconda装在了/root下,我们可以通过执行该命令,实现系统默认某个python版本。[root@Salve7 ~]# alias python

2017-03-12 20:52:57 6358

原创 机器学习总结

学习机器学习模型,要从宏观上来把握该算法。要明白,我们用数据训练模型目的是要训练找出该模型参数。那么有以下几步可以遵循 首先要找到损失函数 然后转化为最优化问题,用梯度下降等方法进行更新 最后模型收敛,得到我们模型的参数注意在找损失函数时有时会遇到这样的情况: 找到的损失函数对该模型的参数并不是连续可导,无法进行更新。这样的话我们就要变换思路换损失函数。

2017-03-12 20:45:10 584

原创 自动评测(ROUGE)及及踩过的坑

最近测试了一个自动摘要的想法,人工看上去还不错。但是没有做评估的话还是心里没底。后来得知,自动摘要用的是一个叫ROUGE的评测体系,包括ROUGE-1、ROUGE-2…ROUGE-N等系列评测方法。于是去ROUGE官网申请,得到一个下载rouge的网址,但是Google一下发现这个评测远不是那么简单。首先,需要安装,于是接下来就开始了我的踩坑之路安装是按照该方法来的:http://www.icst.

2017-03-08 15:23:06 6269

原创 “比赛算法”之xgboost算法系列

前言有幸参加了2016年KDD CUP的数据比赛(2016.03-2016.07),最后获得了第三阶段排名12、总排名31/341的成绩。后来听说当时获得冠军的是清华的一支队伍,用的算法就是xgboost。而后,又陆续听说该算法又获得了两个比赛的冠军,自此,xgboost算法就在我脑海中留下了深刻的印象。xgboost(eXtreme Gradient Boosting)可以说是提升方法的完全加强版

2017-03-07 16:13:17 1810

转载 决策树算法系列——GBDT

参考链接: http://blog.csdn.net/dark_scope/article/details/24863289 http://blog.csdn.net/w28971023/article/details/8240756

2017-03-07 15:59:37 541

原创 决策树系列算法总结——随机森林

改天

2017-03-07 15:50:31 583

原创 机器学习算法分类

算法分类:机器学习的算法繁多,其中很多算法是一类算法,而有些算法又是从其他算法中衍生出来的,因此我们可以按照不同的角度将其分类。本文主要通过学习方式和算法类似性这两个角度将机器学习算法进行分类。学习方式1、监督式学习:从给定的训练数据集中学习出一个函数,当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集需要包括输入和输出,也可以说是特征和目标。训练集中的目标是由人标注的。常见的监督式学习算

2017-03-07 13:45:10 660

原创 决策树系列算法总结——决策树

在机器习算学法中,如果留意的话会一直看到这几个算法的身影。下面对这三个算法进行一下梳理。 Decision Tree ——>Random Forest ——>DBDT基本概念:Decision Tree:决策树Random Forest:中文称随机森林GBDT:Gradient Boosting Decision Tree(梯度提升决策树)。三者关系: 提到森林,我们就会联想到是一棵棵的树构

2017-03-07 13:36:12 1009

转载 Scala入门:类

类和对象是Java、C++等面向对象编程的基础概念。类是用来创建对象的蓝图。定义好类以后,就可以使用new关键字来创建对象简单的类最简单的类的定义形式是:class Counter{ //这里定义类的字段和方法}然后,就可以使用new关键字来生成对象:new Counter //或者new Counter() 给类增加字段和方法下面我们给这个类增加字段和方法:class Count

2017-03-07 10:54:33 351

原创 远程访问(云)服务器上ipython设置

一个好的IED,可以让程序员省心很多。 在本地调试程序,我们可以IDE来进行(如楼主用的python,使用的pycharm),方便快捷 在(云)服务器上调试程序,ipython就是一个不错的选择了。整了一段时间,终于把实验室的ipython环境搭建成功。下面进行一下小结: 环境: 1、centos、python2.7.10、GCC4.4.7 2、在ipython环境前,最好要把python

2017-03-06 16:18:44 2728

原创 节点重要性和相似性

参考书籍:《网络科学导论》 参考博文:http://www.cnblogs.com/maybe2030/p/4665847.html  在我们的现实生活中,许多复杂系统都可以建模成一种复杂网络进行分析,比如常见的电力网络、航空网络、交通网络、计算机网络以及社交网络等等。复杂网络不仅是一种数据的表现形式,它同样也是一种科学研究的手段。复杂网络方面的研究目前受到了广泛的关注和研究,尤其是随着各种在线

2017-03-06 00:22:36 21666 3

转载 scala之数据结构

Scala:数组数组是编程中经常用到的数据结构,一般包括定长数组和变长数组。下面仅介绍定长数组作为入门,变长数组可以自行度娘 定长数组,就是长度不变的数组,在Scala中使用Array进行声明,如下:val intValueArr = new Array[Int](3) //声明一个长度为3的整型数组,每个数组元素初始化为0intValueArr(0) = 12 //给第1个数组元素赋值为12

2017-03-04 14:07:46 1031

转载 scala学习之控制结构

今天接着林老师的scala教程之控制结构,学习内容主要有三个,分别是if 、while、for这三个。不管哪种语言,这三种结构用的都非常非常频繁。所以,sclala语言也不除外。scala:if条件表达式 在Scala中,执行if语句时,会首先检查if条件是否为真,如果为真,就执行对应的语句块,如果为假,就执行下一个条件分支。新建test.scala ,然后 计入编辑,输入如下内容val x

2017-03-03 10:58:47 428

转载 scala学习

参考教程:http://dblab.xmu.edu.cn/blog/spark/ 从头开始学习,一天一部分。(一)安装略 (二)scala基础> 2.1、声明变量Scala有两种类型的变量val类型,是不可变的,在声明时就必须被初始化,而且初始化以后就不能再赋值; scala> val myStr = "Hello World!" myStr:

2017-03-02 12:16:00 637

转载 Attention机制

转载自:http://blog.csdn.net/malefactor/article/details/50550211Attention机制的基本思想是相当直观简洁的,是从人脑注意力模型引入的概念。人脑的注意力模型,说到底是一种资源分配模型,在某个特定时刻,你的注意力总是集中在画面中的某个焦点部分,而对其它部分视而不见。Encoder-Decoder框架可以这么直观地去理解:可以把它看作适合处理

2017-03-01 20:09:46 2102

搭建Hadoop伪分布

搭建hadoop时的手写教程、教你避开一些技术障碍

2016-04-25

自动问答介绍

这是自然语言处理领域(NLP)刚入门时一个不错的参考文档,回顾了该领域的的发展历程及应于技术....

2016-04-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除