自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(37)
  • 资源 (1)
  • 收藏
  • 关注

转载 Hadoop命令

1、列出所有Hadoop Shell支持的命令  $ bin/hadoop fs -help2、显示关于某个命令的详细信息  $ bin/hadoop fs -help command-name3、用户可使用以下命令在指定路径下查看历史日志汇总  $ bin/hadoop job -history output-dir这条命令会显示作业的细节信息,失败和终止的任务细节。

2015-07-23 14:54:13 466

转载 java 学习书籍-想精通java的必看

1. Java 语言基础 谈到Java 语言基础学习的书籍,大家肯定会推荐Bruce Eckel 的《Thinking in Java》。它是一本写的相当深刻的技术书籍,Java 语言 基础部分基本没有其它任何一本书可以超越它。该书的作者Bruce Eckel 在网络上被称为天才的投机者,作者的《Thinking in C++》在 1995 年曾获SoftwareDevelopment

2015-07-23 13:27:20 2147

转载 Adaboost 算法的原理与推导

0 引言    一直想写Adaboost来着,但迟迟未能动笔。其算法思想虽然简单:听取多人意见,最后综合决策,但一般书上对其算法的流程描述实在是过于晦涩。昨日11月1日下午,邹博在我组织的机器学习班第8次课上讲决策树与Adaboost,其中,Adaboost讲得酣畅淋漓,讲完后,我知道,可以写本篇博客了。    无心啰嗦,本文结合邹博之决策树与Adaboost 的PPT,跟他讲Ad

2015-07-23 09:16:35 476

原创 linux下安装maven

1、在https://maven.apache.org/download.cgi#下载apache-maven-3.3.3-bin.tar.gz2、tar zxvf apache-maven-3.3.3-bin.tar.gz,得到apache-maven-3.3.33、将maven复制到集群上的其他机器上:scp -r /home/udms/hadoop/apache-maven-3.3.

2015-07-21 16:31:15 393

原创 看log的重要性

咳咳,觉得自己越来越厉害了啊。。配置玩hadoop集群,却只有namenode 和datanode启动,jobtracker和tastktracker竟让没有启动。。。google良久未果,就去看了下log然后发现是mapred-site.xml配置错了,so改!!!然后就ok了!!哈哈

2015-07-21 15:39:08 389

转载 Python里面如何生成随机数?

So many!!! Python中的random模块用于生成随机数。下面介绍一下random模块中最常用的几个函数。 random.randomrandom.random()用于生成一个0到1的随机符点数: 0 random.uniform  random.uniform的函数原型为:random.uniform(a, b),用于生成一个指定范围内的随机符

2015-07-19 18:59:18 6847

转载 用Python匹配HTML tag的时候,<.*>和<.*?>有什么区别?

当重复匹配一个正则表达式时候, 例如, 当程序执行匹配的时候,会返回最大的匹配值例如:import res = ‘Title’print(re.match(‘’, s).group())会返回一个匹配Title而不是而import res = ‘Title’print(re.match(‘’, s).group())则会返回这种匹

2015-07-19 18:55:12 4917

转载 Python里面search()和match()的区别?

match()函数只检测RE是不是在string的开始位置匹配, search()会扫描整个string查找匹配, 也就是说match()只有在0位置匹配成功的话才有返回,如果不是开始位置匹配成功的话,match()就返回none例如:print(re.match(‘super’, ‘superstition’).span())会返回(0, 5)而print(re.match(‘sup

2015-07-19 18:51:19 5523 1

转载 如何用Python来进行查询和替换一个文本字符串

find()方法可以在一个较长的字符串中查找子串,返回子串坐在位置的最左端索引replace()方法返回某字符串的所有匹配项均被替换之后得到的字符串可能这里问的是正则表达式的东西!!!一、http://www.mianwww.com/html/2009/03/3258.html可以使用sub()方法来进行查询和替换,sub方法的格式为:sub(replacement, st

2015-07-19 18:48:34 6328

原创 如何知道一个python对象的类型?

type()isinstance()

2015-07-19 18:40:41 12744

转载 介绍一下except的用法和作用?

异常处理, 用法...大概有:> except:> except E:> except (E1, E2):> except E, e:> except E as e:精辟!!!

2015-07-19 18:36:58 4021

转载 Python里面如何拷贝一个对象?

So:Python中的对象之间赋值时是按引用传递的,如果需要拷贝对象,需要使用标准库中的copy模块。1. copy.copy 浅拷贝 只拷贝父对象,不会拷贝对象的内部的子对象。2. copy.deepcopy 深拷贝 拷贝对象及其子对象一、http://blog.csdn.net/sharkw/article/details/1934090需求

2015-07-19 17:49:57 7486

原创 Python如何实现单例模式?其他23种设计模式python如何实现?

不会。。。

2015-07-19 17:32:34 1077

原创 2.7 请写出一段Python代码实现删除一个list里面的重复元素

list(set(aa))可是python2.7中的list()不能用囧~

2015-07-19 17:27:41 3606

转载 2.5 how do I iterate over a sequence in reverse order

So:序列(包含列表、元祖以及字符串)中好像就只有列表有a.reverse()但都有reversed(a)一、http://www.mianwww.com/html/2009/08/3615.html如果是一个list, 最快的解决方案是:list.reverse()try:for x in list:“do something with x”finally

2015-07-19 17:06:40 511

转载 2.6 Python里面如何实现tuple和list的转换?

So:tuple()和list(),记住啦~一、http://www.mianwww.com/html/2009/08/3613.html函数tuple(seq)可以把所有可迭代的(iterable)序列转换成一个tuple, 元素不变,排序也不变。例如,tuple([1,2,3])返回(1,2,3), tuple(‘abc’)返回(‘a’.'b’,'c’).如果参

2015-07-19 16:57:51 2552

转载 2.4 Python是如何进行类型转换的?

So:好像没什么可说的,背会记住就ok啦~一、http://canofy.iteye.com/blog/298263函数                      描述  int(x [,base ])         将x转换为一个整数  long(x [,base ])        将x转换为一个长整数  float(x )            

2015-07-19 16:54:26 1746

转载 2.3 解释一下python的 and-or 语法

So:python 的and-or语法 bool and a or b就相当于bool? a: b但是特殊情况是,若a为假,则不会相当于,而是返回b解决办法:用 (bool and [a] or [b])[0]代替当然,负责人的话,就将(bool and [a] or [b])[0]封装成一个函数啦~一、http://www.kuqin.com/diveinto_pyt

2015-07-19 16:49:49 3957

转载 2.2 什么是lambda函数?它有什么好处?

So:什么是lamda函数?lambda 函数是一个可以接收任意多个参数(包括可选参数)并且返回单个表达式值的函数。 (注意:lambda 函数不能包含命令,它们所包含的表达式不能超过一个)lamda函数有什么好处?1、lambda函数比较轻便,即用即仍,很适合需要完成一项功能,但是此功能只在此一处使用,连名字都很随意的情况下;2、匿名函数,一般用来给filter,ma

2015-07-19 16:38:55 11463 1

转载 python题目3

http://python.jobbole.com/81233/此篇文章总结python一些常见的技术问题,每一个都是简短的解释,篇幅不大,不断更新中…解释一下python的 and-or 语法python的and-or常常被用来实现类C语言中的三元运算符:?, 更骚包的写法是 xxx and xxx or xxx and xxx or xxx,连接多个表达式,一行就够

2015-07-19 16:27:50 579

转载 2.1 Python是如何进行内存管理的?

一、http://www.cnblogs.com/vamei/p/3232088.html语言的内存管理是语言设计的一个重要方面。它是决定语言性能的重要因素。无论是C语言的手工管理,还是Java的垃圾回收,都成为语言最重要的特征。这里以Python语言为例子,说明一门动态类型的、面向对象的语言的内存管理方式。 对象的内存使用赋值语句是语言最常见的功能了。但即使是

2015-07-19 16:15:08 2449

转载 python题目2

http://www.douban.com/group/topic/21206826/Python是如何进行内存管理的? http://developer.51cto.com/art/201007/213585.htm (没看懂) 什么是lambda函数?它有什么好处? http://www.kuqin.com/diveinto_python_document/apih

2015-07-19 15:56:19 604

转载 python的7个经典的面试题

http://michaelyou.github.io/2015/05/19/%E7%BF%BB%E8%AF%91-7%E4%B8%AA%E7%BB%8F%E5%85%B8python%E9%9D%A2%E8%AF%95%E9%A2%98/下面的代码输出什么?list = ['a', 'b', 'c', 'd', 'e']print list[10:]上面的代码

2015-07-19 15:54:33 8343 1

转载 python面试题目

http://blog.csdn.net/jerry_1126/article/details/44023949【题目:001】| 说说你对zen of python的理解,你有什么办法看到它?Python之禅,Python秉承一种独特的简洁和可读行高的语法,以及高度一致的编程模式,符合“大脑思维习惯”,使Python易于学习、理解和记忆。Python同时采用了一条极简主义

2015-07-19 13:54:20 2098

转载 Mahout之推荐

http://blog.csdn.net/huhui_cs/article/details/85963883工程开发3.1推荐引擎简介推荐引擎利用特殊的信息过滤(IF,Information Filtering)技术,将不同的内容(例如电影、音乐、书籍、新闻、图片、网页等)推荐给可能感兴趣的用户。通常情况下,推荐引擎的实现是通过将用户的个人喜好与特定的参考特征进行比较,

2015-07-19 10:29:24 660

原创 hadoop问题1

hadoop:执行bin/start-all.sh之后并无什么异常但是!!!却没有hadoop进程o(╯□╰)o这是为什么呢?

2015-07-18 20:35:15 345

转载 hadoop SSH协议

http://m.oschina.net/blog/367856貌似不进行最后一步,slave也是可以无密码访问master的~一、安装和启动SSH协议 假设没有安装ssh和rsync,可以通过下面命令进行安装。sudo apt-get install ssh 安装SSH协议sudo apt-get install rsync

2015-07-18 20:24:35 575

转载 机器学习的数学基础(1)--Dirichlet分布

http://blog.csdn.net/jwh_bupt/article/details/8841644这一系列(机器学习的数学基础)主要包括目前学习过程中回过头复习的基础数学知识的总结。基础知识:conjugate priors共轭先验    共轭先验是指这样一种概率密度:它使得后验概率的密度函数与先验概率的密度函数具有相同的函数形式。它极大地简化了贝叶斯分析。

2015-07-15 19:51:57 602

转载 KNN与Kmeans

问题导读1、什么是K-Means?2、KNN和K-Means的区别有哪些?3、K-Means有哪些缺陷?K-Means介绍K-means算法是聚类分析中使用最广泛的算法之一。它把n个对象根据他们的属性分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。其聚类过程可以用下图表示: 如图所示,数据样本用

2015-07-15 17:31:31 733

转载 FuzzyKmeans的Mahout实现

不得不说,google更靠谱,比google更更靠谱的是官网!!!so要好好利用google and official website!!!https://mahout.apache.org/users/clustering/fuzzy-k-means.htmlFuzzy K-MeansFuzzy K-Means (also called Fuzzy C-M

2015-07-14 16:57:20 1174

转载 mahout中kmeans算法和Canopy算法实现原理

http://www.cnblogs.com/yuhan-TB/p/3380153.html本文讲一下mahout中kmeans算法和Canopy算法实现原理。 一. Kmeans是一个很经典的聚类算法,我想大家都非常熟悉。虽然算法较为简单,在实际应用中却可以有不错的效果;其算法原理也决定了其比较容易实现并行化。学习mahout就先从简单的kmeans算法开始学

2015-07-13 21:58:15 659

转载 机器学习中的相似性度量

http://www.cnblogs.com/heaad/archive/2011/03/08/1977733.html在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。  本文的目的就是对常用的相似性

2015-07-13 21:54:39 375

原创 virtualbox中安装ubuntu

http://www.cnblogs.com/zhcncn/p/3987301.html网上教程有很多滴~但是有一个问题,安装第二个虚拟机的时候,偶尔黑屏,解决办法,多试几次吧O(∩_∩)O~

2015-07-13 14:58:36 323

转载 ubuntu中安装jdk

http://blog.csdn.net/microfhu/article/details/7667393第一步:下载jdk-7-linux-i586.tar.gzwget -c http://download.oracle.com/otn-pub/java/jdk/7/jdk-7-linux-i586.tar.gz  (注:如果下载不下来,建议使用迅雷下载,然

2015-07-13 14:52:32 447

转载 10分钟搞定pandas

本文是对pandas官方网站上《10 Minutes to pandas》的一个简单的翻译,原文在这里。这篇文章是对pandas的一个简单的介绍,详细的介绍请参考:Cookbook 。习惯上,我们会按下面格式引入所需要的包:一、            创建对象可以通过 Data Structure Intro Setion 来查看有关该节内容的详细信息。1、可以通过传递一个list

2015-07-11 18:21:03 1501

转载 55分钟学会正则表达式

正则表达式不容易学, 但是如果能够熟练掌握, 对日常工作是非常有帮助的, 这篇文章是我见过的介绍正则表达式最好的文章, 长度非常合适, 并且深度也把握的非常好, 都是日常用到的知识, 感谢作者的精彩文章. 伯乐在线补充:推荐几个正则表达式编辑器Debuggex :https://www.debuggex.com/PyRegex:http://www.pyregex.com/

2015-07-11 16:54:08 1062

转载 12步轻松搞定python装饰器

12步轻松搞定python装饰器提交我的评论加载中 已评论12步轻松搞定python装饰器 2015-07-06Python开发者 Python开发者呵呵!作为一名教python的老师,我发现学生们基本上一开始很难搞定python的装饰器,也许因为装饰器确实很难懂。搞定装饰器需要

2015-07-11 15:59:39 1145

Weka系统中的关联规则

weka系统中的管理啊规则,lift,leverage,confidence,等等兴趣度度量规则解释和定义

2013-08-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除