自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小黑

English:Talk is cheap,show me the code. 中文:P话少说,放码过来。

  • 博客(10)
  • 资源 (40)
  • 问答 (1)
  • 收藏
  • 关注

原创 使用hadoop平台进行小型网站日志分析

0.上传日志文件到linux中,通过flume将文件收集到hdfs中。执行命令/home/cloud/flume/bin/flume-ng agent -n a4 -c conf -f /home/cloud/flume/conf/a4.conf -Dflume.root.logger=DEBUG,console1.建立hive表create external table bb

2015-03-28 00:35:30 1355

原创 flume分布式日志收集系统操作

1.flume是分布式的日志收集系统,把收集来的数据传送到目的地去。2.flume里面有个核心概念,叫做agent。agent是一个java进程,运行在日志收集节点。3.agent里面包含3个核心组件:source、channel、sink。3.1 source组件是专用于收集日志的,可以处理各种类型各种格式的日志数据,包括avro、thrift、exec、jms、spoo

2015-03-27 19:40:23 1017

原创 map-reduce任务的执行流程

(1).客户端提交一个mr的jar包给JobClient(提交方式:hadoop jar ...)(2).JobClient通过RPC和JobTracker进行通信,返回一个存放jar包的地址(HDFS)和jobId(3).client将jar包写入到HDFS当中(path = hdfs上的地址 + jobId)(4).开始提交任务(任务的描述信息,不是jar, 包括jobid,jar

2015-03-26 22:29:21 958

原创 linux设置定制器自动执行任务

基本格式 : *  *  *  *  *  command 分  时  日  月  周  命令 第1列表示分钟1~59 每分钟用*或者 */1表示 第2列表示小时1~23(0表示0点) 第3列表示日期1~31 第4列表示月份1~12 第5列标识号星期0~6(0表示星期天) 第6列要运行的命令 crontab文件的一些例子: 30 21 * * * /usr/

2015-03-26 22:08:17 1186

原创 pig笔记

1.安装Pig将pig添加到环境变量当中2.pig使用首先将数据库中的数据导入到HDFS上sqoop import --connect jdbc:mysql://192.168.1.10:3306/cloud --username root --password JChubby123  --table trade_detail --target-dir '/sqoo

2015-03-26 22:03:21 586

原创 hbase集群安装和shell操作

1.上传hbase安装包2.解压3.配置hbase集群,要修改3个文件(首先zk集群已经安装好了)注意:要把hadoop的hdfs-site.xml和core-site.xml 放到hbase/conf下让hbase节点知道hdfs的映射关系,也可以在hbase-site.xml中配置3.1修改hbase-env.shexport JAVA_HOME=/

2015-03-24 19:28:06 1265

原创 sqoop操作与使用

sqoop只要安装到集群中的一台节点就可以了1.上传sqoop到节点中2.安装和配置在添加sqoop到环境变量到/etc/profile中将数据库连接驱动拷贝到$SQOOP_HOME/lib里3.使用第一类:数据库中的数据导入到HDFS上sqoop import --connect jdbc:mysql://192.168.1.10:3306/dbTes

2015-03-22 22:27:51 1040

原创 hadoop2.2.0集群安装和配置

hadoop2.0已经发布了稳定版本了,增加了很多特性,比如HDFS HA、YARN等。注意:apache提供的hadoop-2.2.0的安装包是在32位操作系统编译的,因为hadoop依赖一些C++的本地库,所以如果在64位的操作上安装hadoop-2.2.0就需要重新在64操作系统上重新编译集群规划:主机名 IP 安装的软件 运行的进程cloud1 19

2015-03-20 15:35:33 1965 2

原创 mapreduce实现搜索引擎简单的倒排索引

使用hadoop版本为2.2.0倒排索引简单的可以理解为全文检索某个词例如:在a.txt 和b.txt两篇文章分别中查找统计hello这个单词出现的次数,出现次数越多,和关键词的吻合度就越高现有a.txt内容如下:hello tomhello jerryhello kittyhello worldhello tomb.txt内容如下:hello jerry

2015-03-19 15:41:09 2376

原创 hadoop2.2.0伪分布式安装

修改主机名和IP的映射关系vi /etc/hosts 192.168.61.44 hadoop关闭防火墙#查看防火墙状态service iptables status#关闭防火墙service iptables stop#查看防火墙开机启动状态chkconfig iptables --list#关闭防火墙开机启动chkconfig iptab

2015-03-12 21:52:23 672

数据安全管理办法(征求意见稿).pdf

国家互联网信息办公室《数据安全管理办法》。

2019-11-06

关于侵犯公民个人信息刑法案件适用法律若干问题的解释.pdf

最高人民法院、最高人民检察院,关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释。

2019-11-06

idea开发drools的设置文件

打开idea,import settings,之后新建drl文件可以得到drools的智能提示,但是没有代码格式化的功能

2016-03-28

peoplerank算法测试数据集

https://github.com/chubbyjiang/MapReduce

2016-03-09

庖丁分词jar包和dic目录

https://github.com/chubbyjiang/MapReduce

2016-02-29

庖丁分词测试数据集 工具

庖丁分词测试数据集 工具

2016-02-29

测试mahout推荐算法的数据集

https://github.com/chubbyjiang/MapReduce

2016-02-28

统计移动运营商用户基站数据

统计移动运营商用户基站数据

2016-02-22

网站kpi统计数据

网站kpi统计数据

2016-02-22

hadoe2ee2e2e2

hadoop2.zip

2015-11-06

推荐系统源码

推荐系统源码

2015-07-01

tachyon-0.6.4-bin.tar.gz

tachyon-0.6.4-bin.tar.gz tachyon-0.6.4-bin.tar.gz tachyon-0.6.4-bin.tar.gz tachyon-0.6.4-bin.tar.gz 官网国内可能访问不了 这里提供下载

2015-05-29

基于spark的电影推荐系统数据集

基于spark的电影推荐系统数据集

2015-05-27

spark Mllib 协同过滤测试数据

spark Mllib 协同过滤测试数据

2015-05-27

Spark mllib 线性回归测试数据

Spark mllib 线性回归算法测试数据

2015-05-27

idea scala插件

scala-intellij-bin-1.5.zip

2015-05-24

fpg算法例子

运行mahout自带的fpg算法的练习数据

2015-04-10

kmeans例子

使用mahout中的kmeans算法需要的练习数据

2015-04-10

.Net OSS操作代码

.Net程序测试使用阿里云OSS代码例子 包含一些常见的Bucket和Object操作

2014-12-11

OSS相关文件

阿里云OSS 的操作 API文档 和.Net SDK

2014-12-11

委托实现C#观察者模式简单例子

委托实现C#观察者模式简单例子

2014-07-27

接口实现C#观察者模式简单例子

接口实现C#观察者模式简单例子

2014-07-27

PortMap端口映射

PortMap端口映射器 开发测试的时候很好用

2014-07-11

json.net组件

json.net组件

2014-07-11

C#处理Ubb代码类

C# 处理Ubb代码向html代码转换 辅助工具类 酌情修改

2014-07-10

FtpClient C#ftp辅助类

FtpClient C#ftp辅助类 提供多种ftp操作

2014-07-10

Xlight_FTP_Server

Xlight_FTP_Server ftp服务器 开发测试的时候可以使用

2014-07-10

SWFUpload 异步文件上传

SWFUpload 异步文件上传 js插件

2014-07-10

.netNPOI 插件

NPOI .net操作excel导入导出插件

2014-07-10

.net Reflector

.net Reflector .net反编译神器

2014-07-10

jqzoom_ev1.0.1

jqzoom_ev1.0.1 实现放大镜的js效果

2014-07-10

jquery-ui插件

jquery-ui 很酷炫的js插件 效果

2014-07-10

jquery-easyui

jquery-easyui 很好用的js插件

2014-07-10

jQuery_validate

jQuery_validate js插件 jQuery_validate

2014-07-10

FileZilla_gr

FileZilla_grFTP客户端 在本地电脑使用

2014-07-10

Coding4Fun

Coding4Fun WP开发

2014-07-10

ckeditor_v3.6.5

ckeditor_v3.6.5版本 带ubb编辑器

2014-07-10

模拟支付宝程序

c#模拟支付宝程序 做了修改 简单易用 用vs2010打开即可使用

2014-07-10

ajaxForm插件

ajaxForm插件

2014-07-10

C#编写的模拟操作系统虚拟内存分页请求管理

C#编写的模拟操作系统虚拟内存分页请求管理 计算机操作系统第三版 汤小丹等编著 根据课本算法流程编写 原创

2014-06-13

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除