重设SVN 的GNOME keyring [(null)] 的密码 在ubuntu里如果改了登录密码,那么在使用svn是会要求GNOME keyring [(null)] 的密码:去掉这个只需:rm -f ~/.gnome2/keyrings/login.keyring
hive reduce资源数过多导致集群内资源堵塞方案解决 我们先看一看map中对reduce个数产生影响的两个参数hive.exec.reducers.bytes.per.reducer(每个reduce任务处理的数据量,默认为1000^3=1G) hive.exec.reducers.max(每个任务最大的reduce数,默认为999)hive计算reducer数的公式很简单N=min(参数2,总输入数据量/参数1) ,即如果reduce的输...
python编码设置 当我们的python源文件中出现中文的问题是,我们便需要指定源文件中的编码,这样解释器就会使用指定编码去解释源文件,python默认编码如果我们木有制定的话默认是ASCII通过python官方文档,如果我们对python源文件指定编码的话我们必须如下图一样声明注释在第一行或者第二行例如# coding=<encoding name> 例如 # -*- ...
mahout0.7成功编译总结 欢迎喜欢深入了解推荐系统和mahout的兄弟加入群 推荐系统之Mahout 135918911 一直在学习mahout,工作中使用的是0.7跑算法,进行测试,但是在使用maven导入eclipse中构建的时候出现了问题,首先由于m2e的lifeStyle覆盖问题,两个插件不能使用,如下图 m2e插件现在已经被eclipse托管,在看eclipse官方网站看过...
MahoutDriver运作机制-mahout源码学习及总结 欢迎喜欢深入了解推荐系统和mahout的兄弟加入群 推荐系统之Mahout 135918911 mahout入口类MahoutDriver 如果我们想要研究MahoutDriver的源码,没有什么比测试类更好的了,下面我们看一下测试类 public final class MahoutDriverTest { //测试MahoutDriver.m...
mahout推荐引擎相似度计算之皮尔逊相关性 欢迎喜欢深入了解推荐系统和mahout的兄弟加入群 推荐系统之Mahout 135918911 在讲解皮尔逊相关性之前我们先讲解一下z分数 z分数(z-score),也叫标准分数(standard score)是一个分数与平均数的差再除以标准差的过程。z分数可以回答这样一个问题:"一个给定分数距离平均数多少个标准差?"在平均数之上的分数会得到一个正的标准分数,在平均数之...
mahout脚本调用流程分析 欢迎喜欢深入了解推荐系统和mahout的兄弟加入群 推荐系统之Mahout 135918911 剖析mahout脚本 mahout 位于$MAHOUT_HOME/bin目录下,是所有mahout调用的入口。主要会做各类环境变量的设置。MAHOUT_JAVA_HOME:指定java的执行路劲,会覆盖$JAVA_HOMEMAHOUT_HEAPSIZE :JA...
Win7+Ubuntu11.10(EasyBCD硬盘安装) 1)首先还是分区,在计算机上右键--管理--磁盘管理装Ubuntu分配的硬盘大小最好是(20G以上)不要太小,这里请注意,ubuntu和windows文件系统完全不同,所以我们划好要给ubuntu的分区后,删除卷。到时候,安装好的ubuntu的分区,在windows下是看不到的,但是进入ubuntu是可以访问windows的磁盘的。这才叫双系统的吧,和wubi那种不一样哦。2)...
linux-memcache下的安装 Memcache是什么Memcache是danga.com的一个项目,最早是为 LiveJournal 服务的,目前全世界不少人使用这个缓存项目来构建自己大负载的网站,来分担数据库的压力。它可以应对任意多个连接,使用非阻塞的网络IO。由于它的工作机制是在内存中开辟一块空间,然后建立一个 HashTable,Memcached自管理这些HashTable。Memcache官方网站:http://w...
linux shell实现随机数多种方法 shell脚本程序我们有那些获得随机数方法呢?一、通过时间获得随机数(date)这个也是我们经常用到的,可以说时间是唯一的,也不会重复的,从这个里面获得同一时间的唯一值。适应所有程序里面了。 date +%s1287764773获得时间戳,当前到:1970-01-01 00:00:00 ...
linux-模拟dos2unix命令 虽然我不是运维工程师,但是由于学习linux和shell脚本也遇到过了一些有趣的问题,例如我们常常把window环境下的文本文件上传到linux上,由于2者结束符的不同,有时候会出现配置问题 因为linux并不认识原有window环境结束符,从而在原有结束符下重新添加结束符,我们使用 cat -v -E test.txt 查看数据 -v 是隐藏字符 -E是 结束符显示,数据如下3...
自然语言处理--信息模型 今天拜读了数学之美的第一章,例举的例子感觉真是浅显易懂,这里不禁要对吴军老师的写作功底拜服,下面谈谈对信息模型的理解,数字、文字和语言作为信息的载体,他们的目的都是记录和传播信息,就像我们的老祖先一样乌拉乌拉几句,对方就明白了,你丫的骂我,拿起石头就扔过去了,其实他们的这种交流可以概括为信息1--编码(也就是怪叫)---信息2(听到的声音)-----解码----信息1(得到原始信息),其实...
自然语言处理--从规则到统计 目前各大互联网公司都如火如荼的在研发者自己的推荐业务,因此机械学习、人工智能,数据统计分析建模变成了一个当下很热门的研究方向,那么计算机如何智能的处理自然语言呢,比如最近流行的小黄鸡应用,你的一问一答,他都会憨态可掬的作出很黄很暴力的回答。那么他是怎么处理和分析语言的呢,其实任何一种语言都是一种编码方式,人说话其实就是把想表达的意思进行编码, 编码形式 可以使声音 也可以是电流也可...
GT-P7300刷机打电话 网上得知GT-P7300可以刷打电话功能,于是网上寻找各种教程,中文的,英文的,各种亲身尝试,经历过成为板砖的痛苦,不过最终还是rom成功升级为4.0.4,成功刷出拨打电话和收发短信功能,并且可以利用移动数据流量上网,看着美美的主题,流畅的操作,心里那叫一个美啊,为了帮助菜鸟们成功刷机现在把我刷机的过程和所用工具全部奉上(好多论坛恶心的要下载积分),成功刷机请多多留言,赞一个哈下载一下...
GT-P7300刷机打电话 网上得知GT-P7300可以刷打电话功能,于是网上寻找各种教程,中文的,英文的,各种亲身尝试,经历过成为板砖的痛苦,不过最终还是rom成功升级为4.0.4,成功刷出拨打电话和收发短信功能,并且可以利用移动数据流量上网,看着美美的主题,流畅的操作,心里那叫一个美啊,为了帮助菜鸟们成功刷机现在把我刷机的过程和所用工具全部奉上(好多论坛恶心的要下载积分),成功刷机请多多留言,赞一个哈下载一下...
memcached缓存失效时的高并发访问问题解决 memcached一般用于在访问一些性能相对低下的数据接口时(如数据库),为了保证这些数据接口的稳定性,加上memcached以减少访问次数,保证这些数据接口的健壮性。一般memcached的数据都是定时失效的,当数据失效时一般会再次去访问取数据接口,然后将其更新至memcached中。这时就会有一个问题,当某个数据失效时,恰好同时有大量的客户端访问该数据,这时这些客户端都会发现该数据失效,...
一个项目tomat 确启动两次 只有一个项目,Tomcat启动了两次。在Eclipse里只新建了一个项目,因为该项目里表太多,而技术架构是Spring+Hibernate,所以启动是比较慢,需要初始化Hibernate映射文件和Spring的配置文件,因为这个原因所以和别的项目分开,用了一个新的Eclipse环境,项目名称假设是TestProject,设置Context Root时用了test,然后启动项目run on...
JVM基础 之java内存管理以及GC (强烈推荐)(转载) 内存管理简介 内存管理的职责为分配内存,回收内存。 没有自动内存管理的语言/平台容易发生错误。 典型的问题包括悬挂指针问题,一个指针引用了一个已经被回收的内存地址,导致程序的运行完全不可知。 另一个典型问题为内存泄露,内存已经分配,但是已经没有了指向该内存的指针,导致内存泄露。 程序员要花费大量时间在调试该类问题上。 GC简介 因此引入了Garbage Collector机制,由运行时环境来自动管...
java泛型类型擦除 先上一段代码,猜猜会出现的问题 public void test(List<String> value){ System.out.println("List<String> value"); } public void test(List<Integer> value){ System.out.println("List...