自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(42)
  • 资源 (1)
  • 收藏
  • 关注

转载 推荐系统:主要推荐方法

在推荐系统简介中,我们给出了推荐系统的一般框架。很明显,推荐方法是整个推荐系统中最核心、最关键的部分,很大程度上决定了推荐系统性能的优劣。目前,主要的推荐方法包括:基于内容推荐、协同过滤推荐、基于关联规则推荐、基于效用推荐、基于知识推荐和组合推荐。一、基于内容推荐基于内容的推荐(Content-based Recommendation)是信息过滤技术的延续与发展,它是建

2013-12-31 17:23:57 1393

转载 基于内容的推荐系统概述

一、系统的概述协同过滤方法只考虑了用户评分数据, 忽略了项目和用户本身的诸多特征, 如电影的导演、演员和发布时间等, 用户的地理位置、性别、年龄等. 如何充分、合理的利用这些特征, 获得更好的推荐效果, 是基于内容推荐策略所要解决的主要问题.基于内容的推荐系统:根据历史信息(如评价、分享、收藏过的文档)构造用户偏好文档, 计算推荐项目与用户偏好文档的相似度, 将最相似的项目推荐给用

2013-12-31 14:47:10 1437

转载 DES加密算法java实现(核心算法+源代码)

原文地址:http://www.the5fire.com/DES%E5%8A%A0%E5%AF%86%E7%AE%97%E6%B3%95java%E5%AE%9E%E7%8E%B0%EF%BC%88%E6%A0%B8%E5%BF%83%E7%AE%97%E6%B3%95+%E6%BA%90%E4%BB%A3%E7%A0%81%EF%BC%89.html#comments其实有了前一篇文章《

2013-12-29 22:07:41 1176

转载 利用python实战开发一个web管理系统框架

http://edu.51cto.com/lesson/id-17442.html

2013-12-29 21:54:29 3465

转载 手动装配Hadoop Cloudera CDH4.2版本

原文地址:http://www.myexception.cn/cloud/1343006.html1手动安装Hadoop Cloudera CDH4.2版本此文由本人调试整理通过,转载请注明出处,谢谢!目录第1章 概要说明41.1 Hadoop是什么?41.2 为什么选择CDH版本?41.3 集群配置环境41.4 网络结构图5第2章 安装hadoop

2013-12-29 14:34:03 1000 1

转载 用editplus编写好看的shell脚本

下载bash.acp和bash.stx文件,这两个文件是分别实现语法高亮和语法自动完成用的。http://pan.baidu.com/share/link?shareid=92073&uk=1729651712保存至ediplus安装目录 在editplus配置里仿以下配置: 函数模板正则表达式: function[ \t]+[0-9a-

2013-12-26 16:55:39 1473

转载 windows下Python+Editplus windows Python开发环境

点评:Python的安装程序以及源代码可以从其官方网站http://www.python.org/获取。以Windows XP、Python 3.1.3为例,在Windows下安装Python的过程如下。(1)从Python官方网站http://www.python.org/download/下载Python Windows下的最新的安装程序(python-3.1.1.msi)。

2013-12-26 13:32:02 594

转载 git中文网站

http://git-scm.com/book/zh/ch2-5.html

2013-12-25 21:24:20 1271

转载 大型网站技术架构:核心原理与案例分析

http://item.jd.com/11322972.html

2013-12-24 18:15:00 669

转载 利用eclipse构建和部署maven工程

一、环境 OS:win7 jdk:1.6 maven:3 eclipse:jee3.6+m2eclipse tomcat:6 二、创建由maven构建的web工程 1、创建maven工程 mvn archetype:generate 在出现的archetype列表中可选择一个合适的编号,例如 197: remote -> struts2-archetyp

2013-12-24 18:09:18 621 1

转载 Maven常见问题

Maven,发音是[`meivin],"专家"的意思。它是一个很好的项目管理工具,很早就进入了我的必备工具行列,但是这次为了把ABPM项目 完全迁移并应用maven,所以对maven进行了一些深入的学习。写这个学习笔记的目的,一个是为了自己备忘,二则希望能够为其他人学习使用maven 缩短一些时间。maven概要首先我把maven的概念快速的梳理一下,让我们快速地建立起一个比较精确

2013-12-24 18:08:35 538

转载 git将本地仓库上传到远程仓库

2011-11-04 14:45:15分类: LINUX在已有的git库中搭建新库,并且将本地的git仓库,上传到远程服务器的git库中,从而开始一个新的项目首先,在本地新建文件夹abc,进入到abc里面,然后git init。这样就在本地初始化了一个git项目abc。然后,登录到远程的git服务器上,到gitrepo目录下面,mkdir abc.git

2013-12-22 18:18:24 908

转载 linux shell 数组建立及使用技巧

linux shell在编程方面比windows 批处理强大太多,无论是在循环、运算。已经数据类型方面都是不能比较的。 下面是个人在使用时候,对它在数组方面一些操作进行的总结。 1.数组定义 [chengmo@centos5 ~]$ a=(1 2 3 4 5)[chengmo@centos5 ~]$ echo $a1 一对括号表示是数组,数组元素用“空格”符号分割开

2013-12-21 19:57:40 348

转载 shell数组小结

不知道 是什么时候写的东西,整理文档时被考古发现,给那些闲着蛋疼之人,一笑而过吧。如果本文中的错误给您带来所有的精神损失,请找保险公司理陪!当然你可以告诉我 (倾诉) 数组作为一种特殊的数据结构在任何一种编程语言中都有它的一席之地,当然bash shell也不例外。本文就shell数组来做一个小的总结。在这里只讨论一维数组的情况,关于多维数组(事实上,你得用一维数组的方法来模拟),不涉

2013-12-21 19:56:55 450

转载 cronExpression表达式解释

0 0 12 * * ?---------------在每天中午12:00触发 0 15 10 ? * *---------------每天上午10:15 触发 0 15 10 * * ?---------------每天上午10:15 触发 0 15 10 * * ? *---------------每天上午10:15 触发 0 15 10 * * ? 2005---------

2013-12-19 18:15:27 489

转载 不同操作系统获取文件路径分隔符

System.out.println(java.io.File.separator);System.out.println(System.getProperty("file.separator"));

2013-12-19 18:13:13 798

转载 quartz使用cron表达式的实例

转载注明原文地址:http://thetopofqingshan.iteye.com/blog/1554390前提信息:quartz版本信息: 2.1.5假设读者知道:cron表达式附件:quartz.jar及实例代码实例代码jobJava代码  package com.qingshan.job;   

2013-12-19 15:32:46 954

转载 Java Quartz 自动调度

[java]package com.test;  import org.quartz.Job; import org.quartz.JobExecutionContext; import org.quartz.JobExecutionException;  public class CallGirl implements Job {          publi

2013-12-19 13:04:05 387

转载 java定时执行代码(转)

我们在项目中,经常会碰到这样一种需求,就是让某个程序在某个固定的时间去运行,比如定时备份操作。在Java的J2SE的API中可以很容易做到这一点。让我们需要定时执行的类继承自java.util.TimerTask中的TimerTask类,把需要执行的方法放入run方法中:1 import java.util.TimerTask;2 3 public class MyTimerTas

2013-12-19 12:24:55 530

转载 程序员技术练级攻略

月光博客6月12日发表了《写给新手程序员的一封信》,翻译自《An open letter to those who want to start programming》,我的朋友(他在本站的id是Mailper)告诉我,他希望在酷壳上看到一篇更具操作性的文章。因为他也是喜欢编程和技术的家伙,于是,我让他把他的一些学习Python和Web编程的一些点滴总结一下。于是他给我发来了一些他的心得和经历

2013-12-18 22:41:11 429

转载 Java程序打成jar包 如何处理第三方jar包

eclipse的export的 runnable jar file 导出的jar包的形式应该可以避免这个问题,直接想所依赖的jar里的class文件也一并打入jar包里了。--------------------------------------------------------------------------------问题一:现在有一j2se程序,依赖于jd

2013-12-18 20:04:02 684

转载 Jetty

转载自:http://www.cnblogs.com/eafy/archive/2007/10/24/906792.htmlJetty 是一个开源的servlet容器,它为基于Java的web内容,例如JSP和servlet提供运行环境。Jetty是使用Java语言编写的,它的API以一组JAR包的形式发布。开发人员可以将Jetty容器实例化成一个对象,可以迅速为一些独立运行(stand-al

2013-12-18 01:06:04 408

转载 for,foreach,iterator的用法和区别

相同点:   三个都可以用来遍历数组和集合不同点:1.形式差别                  for的形式是                for(int i=0;i                  foreach的形式是                for(int i:arr){...}                  iterator的形式是 

2013-12-18 01:03:58 433

转载 HTTP协议下实现上传文件

原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 、作者信息和本声明。否则将追究法律责任。http://luecsc.blog.51cto.com/2219432/1113654         一、HTTP协议基础        1、HTTP协议概念         协议是指计算机通信网络中两台计算机之间进行通信所必须共同遵守的规定或规则,超文本传输协议

2013-12-17 20:42:23 1338 1

转载 Git 远程仓库的管理和使用

要参与任何一个 Git 项目的协作,必须要了解该如何管理远程仓库。同他人协作开发某个项目时,需要管理这些远程仓库,以便推送或拉取数据,分享各自的工作进展。管理远程仓库的工作,包括添加远程库,移除废弃的远程库,管理各式远程库分 支,定义是否跟踪这些分支,等等。本文我们将详细讨论远程库的管理和使用。AD:2013云计算架构师峰会课程资料下载要参与任何一个 Git

2013-12-17 19:54:24 489

转载 HIVE中map,array和structs使用

C++C#J#1:怎样导入文本文件(格式是怎样的?),2:怎样查询数据,已经能否在join中使用?在子查询中使用?等等知道怎么在hive中导入数组不?例如:我想把 数组[1,2,3] 和 数组 ["a","b","c"]导入到table1中create table table2 ( a array , b array);那么 我如何 导入呢?使得sele

2013-12-17 11:31:05 415

转载 SQL中排名函数

SQL Server 提供了一组排名函数(Ranking Functions),为结果集分区中的每一行返回一个排名值。根据所用到的函数和选项,某些行的排名值可能相同。排名函数包括RANK, NTILE, DENSE_RANK, ROW_NUMBER 四种,这四种函数使用方法很相似,只是功能稍微有所不同,我们用一些例子来说明用法。group_id (组编号) user_id(学号) sc

2013-12-16 11:22:35 1187

原创 mysql直接读cvs文件到数据表中

LOAD DATA INFILE "d:\\test\\haha.csv" REPILCE INTO TABLE 'myTable' \ FIELDS TERMINATED BY "," \ OPTIONALLY ENCLOSED BY """ \ESCAPED BY "\\" \LINES TERMINATED BY "\r\n"

2013-12-16 10:25:42 535

转载 hive中的时间处理函数

日期函数UNIX时间戳转日期函数: from_unixtime语法:   from_unixtime(bigint unixtime[, string format])返回值: string说明: 转化UNIX时间戳(从1970-01-01 00:00:00 UTC到指定时间的秒数)到当前时区的时间格式举例:hive>   select from_unixtime(

2013-12-12 19:47:21 566

转载 Linux常用命令大全

系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作   系统信息 a

2013-12-12 12:23:12 477

转载 【一周观察】动辄9位数以上的投资,云数据中心缺口巨大!

移动互联、云计算、大数据、物联网等新技术与应用的飞速增长,数据中心已经成为一类稀缺资源,尤其是动辄9位数以上投资的云数据中心。尽管悄无声息,但国内云数据中心建设已经进入跑马圈地的阶段。【CSDN云计算频道观察】数据中心(Data Center),毫无疑问,是一整套复杂的设施。不仅仅包括IT系统(服务器、存储、网络)和其它与之配套的设备(供电、制冷与空调系统)与软件监控与管理系统,还包含

2013-12-11 09:40:20 1994

转载 Shark简介、部署及编译小结

Shark简介Shark即Hive on Spark,本质上是通过Hive的HQL解析,把HQL翻译成Spark上的RDD操作,然后通过Hive的metadata获取数据库里的表信息,实际HDFS上的数据和文件,会由Shark获取并放到Spark上运算。Shark的特点就是快,完全兼容Hive,且可以在shell模式下使用rdd2sql()这样的API,把HQL得到的结果集,继续在scal

2013-12-11 01:41:23 630

转载 大圆那些事中的Storm和hbase系列地址

Storm:http://www.cnblogs.com/panfeng412/tag/Storm/ hbase:http://www.cnblogs.com/panfeng412/tag/HBase/

2013-12-11 00:36:57 493

转载 Storm常见模式——分布式RPC

本文翻译自:https://github.com/nathanmarz/storm/wiki/Distributed-RPC,作为学习Storm DRPC的资料,转载必须以超链接形式标明文章原始出处及本文翻译链接。分布式RPC(distributed RPC,DRPC)用于对Storm上大量的函数调用进行并行计算过程。对于每一次函数调用,Storm集群上运行的拓扑接收调用函数的参数信息作为输入

2013-12-11 00:29:24 439

转载 linux系统进程管理命令

Linux进程管理是一项十分重要的工作,可以帮助我们更好的控制系统。这里简单介绍一下Linux进程操作名令,让初学者了解Linux中进程的管理。AD:2013云计算架构师峰会课程资料下载Linux进程管理是一项十分重要的工作,可以帮助我们更好的控制系统。进程是程序在计算机上的一次执行活动。当你运行一个程序,你就启动了一个进程。这里介绍常用进程操作命令。

2013-12-10 18:17:42 1513

转载 hadoop单元测试方法--使用和增强MRUnit

http://jen.iteye.com/blog/10038621前言         hadoop的mapreduce提交到集群环境中出问题的定位是比较麻烦的,有时需要一遍遍的修改代码和打出日志来排查一个很小的问题,如果数据量大的话调试起来相当耗时间。因此有必要使用良好的单元测试手段来尽早的消除明显的bug(当然仅有单元测试是不够的,毕竟跟集群的运行环境还是不一样的)。      

2013-12-10 13:30:19 528

转载 一个小脚本从小说中过滤出经常出现的人名

一个小脚本从小说中过滤出经常出现的人名 花名获取利器! 作者:高鹏 小说中,人名后经常跟着一个动词或者介词,根据这一点可以找出常见的人名。下面用一个小shell脚本来玩一下^.^ 脚本如下: Shell代码  #!/bin/sh  # name:filter_name.sh  # JH Gao   # function:从小说中过滤出

2013-12-06 15:29:00 886

转载 python中List的sort方法(或者sorted内建函数)的用法

python列表排序 简单记一下python中List的sort方法(或者sorted内建函数)的用法。 关键字: python列表排序 python字典排序 sorted List的元素可以是各种东西,字符串,字典,自己定义的类等。 sorted函数用法如下: Python代码  sorted(data, cmp=None, k

2013-12-06 15:24:40 744

转载 支持中文文本的数据挖掘平台开源项目PyMining发布

前言     最近一个月,过年的时候天天在家里呆着,年后公司的事情也不断,有一段时间没有更新博客了。PyMining是我最近一段时间构思的一个项目,虽然目前看来比较微型。该项目主要是针对中文文本的数据挖掘算法的实验与应用。从项目的目标来说,希望使用者可以很方便的使用现有的数据挖掘、机器学习算法与添加需要的算法。项目概述     项目目前主要关注中文文本的数据挖掘算法。由于每种数

2013-12-03 21:00:11 893

转载 PyMining-开源中文文本数据挖掘平台 Ver 0.1发布

http://code.google.com/p/python-data-mining-platform/ (可能需翻墙)目前已经在该googlecode中加入了Tutorial等内容,可以在wiki中查看项目介绍(复制自项目首页的说明):这是一个能够根据源数据(比如说用csv格式表示的矩阵,或者中文文档)使用多种多样的算法去得到结果的一个平台。  算法能够

2013-12-03 20:25:22 495

Windows上安装Hadoop教程

Windows上安装Hadoop教程

2012-10-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除