自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

孤独的博客

just do it

  • 博客(141)
  • 资源 (7)
  • 问答 (1)
  • 收藏
  • 关注

原创 Python学习之第二周

深入理解Pyhton语言实例2:Pyhton蟒蛇绘制模块1:turtle库的使用turtle程序语法元素分析深入理解Python语言计算机技术的演进1946-1981计算机系统结构时代1981-2008网络和视窗时代2008-2016复杂信息系统时代2016-人工智能时代编程语言的多样性Python语言特点Pyhton语言...

2019-09-25 17:36:22 123

原创 Python学习之第一周

1. 程序设计基本方法2. Python开发环境配置3. 实例1:温度转换4. Python程序语法元素分析程序设计基本方法计算机与程序设计 功能性:对数据的操作,表现为数据计算、输入输出和结果存储 可编程性:根据一系列指令自动地、可预测地、准确地完成操作者的意图 计算机硬件所依赖的集成电路规模参照摩尔定律发展 计算机运行速度因此也接近几何级数快速增长 ...

2019-09-20 20:23:07 230

原创 IP详述

进制转换 IP地址基础 CIDR和VLSM A、B、C类地址快速划分方法 子网划分 路由汇总进制转换二进制转换成十进制二进制每位权值128 64 32 16 8 4 2 1技巧:利用“1”的权值相加十进制转换成二进制权值相凑IP地址基础IP地址用于在Internet上标识计算机,软件地址与之相对:MAC地址硬件地址,也称烧录地址,在本地网络上(如以太...

2019-09-11 10:29:20 565

原创 密码学之流密码

流密码流密码将明文消息按字符逐位加密,它采用密钥流生成器(KG),从种子密钥生成一串密钥流字符来加密信息,每个明文字母被密钥流中不同的密钥字符加密。同步流密码密钥流的产生独立于明文流和密文流的流密码。同步流密码各符号之间是真正独立的,一个字符传播错误只会影响一个符号,不会影响后继的符号。自同步流密码(异步流密码)自同步流密码的产生与已经产生的一定数量的密文有关,通常第i个密钥...

2019-09-10 12:46:53 1587 3

原创 密码学之分组密码设计及DES算法设计

分组密码:对明文加密时,首先要对明文进行分组,每组的长度相同,然后对每组明文分别加密,得到等长的密文。特点:速度快、易于标准化、便于软硬件实现设计要求:分组长度n要足够大秘钥空间要足够大密码变换必须足够复杂分组密码设计原则和方法混淆:所设计的密码应使得秘钥和明文以及密文之间的依赖关系相当复杂,以至于这种依赖性对密码分析者来说无法利用扩散:所设计的密码应使得秘钥的每一位影响密文...

2019-09-09 18:13:39 4022 1

原创 用IO处理数据流之对象序列化与反序列化

序列化将一个内存中保存的对象变成一个二进制的数据流进行传输,但并不是所有类的对象都可以进行序列化操作,如果一个对象需要被序列化,则对象所在的类必须实现Serializeble接口。此接口中没有任何的方法定义,是作为标识接口出现的实体类标注为可以序列化package IO;import java.io.Serializable;public class Person implement...

2019-09-09 13:05:06 185

原创 用IO处理数据之缓冲流

缓冲流原理就是将数据先缓冲起来,然后一起写入或读取出来,使用缓冲流读写文件非常高效,常用的缓冲流:BufferedReader、BufferedWriter、BufferedInputStream、BufferedOutputStreamBuffferedReader与BufferedWriterBufferedReader属于字符流,如果使用BufferedReader流,就需要将一个字节...

2019-09-09 12:44:30 165

原创 用IO处理数据之内存操作流

内存操作流将输入输出的位置改变成了内存,就称为内存操作流,使用ByteArrayOutputStream完成内存的输出操作import java.io.*;public class ByteOutputStreamDemo { public static void main(String[] args) throws IOException { outin(); ...

2019-09-09 12:01:06 150

原创 用IO进行数据处理之过滤流

过滤流通常字节流只具有读写字节内容的方法,它们只能在文件中读取或者向文件中写入字节,在实际开发中往往需要在文件中读取或写入各种类型的数据,(整型、布尔类型等),就必须先将其他类型的数据转换成字节数组后写入文件,或者从文件中读取字节数组转换成其他数据类型,这时候需要包装类。DataOutputStream对于DataOutputStream必须给它一个输出流对象,完成类似DataOutput...

2019-09-09 11:49:45 279

原创 用IO进行数据处理之字符流

字符流字符输出流Writer是字符输出流,该类是一个抽象类,所以要用子类FileWriter类来操作文件package IO;import java.io.FileWriter;import java.io.IOException;public class WriterDemo { public static void main(String[] args) throws ...

2019-09-09 10:48:58 114

原创 用I/O进行数据处理之字节流

I/O主要是对文件进行处理,主要包括三个方面:input、out、File文件操作java.io包里面,该包下面有File类,Java提供的File类只能创建文件、删除文件、对文件属性进行操作,并不能对文件里面的内容进行读写操作文件常见属性操作package IO;import java.io.File;import java.io.IOException;import j...

2019-09-08 23:31:03 163

原创 路由和交换机技术第一节课总结

网络相关知识概述网络分层的优点 简单化 标准化 互联互通 模块化TCP/IP和OSI的比较Application应用层Presentation表示层Session会话层Transport传输层Network网络层data Link数据链路层Physical物理层TCP/IP协议组中常用的协议TCP/IP模型...

2019-09-06 19:17:05 800

原创 密码学之对称密码体制

对称密码体制:加密密钥与解密秘钥相同的密码体制,这种体制只要加密(或解密)算法,就可以反推出解密(或加密)算法对称密码体制可以分为分组密码和流密码古典密码是现代密码的基础,包含着密码处理的基本单元,历史上经典的对称密码体制都采用了替代、置换替代:将明文中每个元素映射为另一个元素(可以看成是一个大的查表运算),明文元素被其他元素所替代而形成密文置换:换位,改变明文消息中各元素的排列位置,但明...

2019-09-04 19:31:22 6029

原创 密码学基础之基本概念

今天上了老师的课,知道了密码学的一些概念和一些基础知识,想总结总结分享给大家密码学:用基于数学方法的程序和保密的秘钥对信息进行编码,把信息变成一段杂乱无章难以理解的字符串,也就是把明文转变成密文。密码学只要分为两个分支:密码编码学,密码分析学密码编码学:主要研究对信息进行变化,以保护信息在信道传递过程中不被敌手窃取、解读和利用的方法(如何加密)密码分析学:过程与之相反密码学的基本概念:...

2019-09-03 12:51:26 1267

原创 集合

在编程语言中,数组有一个致命的缺点,一旦数组的大小确定,则其大小不能改变。在实际场景中,我们不可能确定数组的大小,所以这个时候,就要使用java的集合。Why?集合可以认为是一种可变的数组,大小可以随着元素的增加而增加。集合的容量是可变的,扩展性比较好。What?Java中集合位于java.util包下...

2019-09-02 10:42:57 99

原创 Maven简介

以前老是写代码,也没有深深的研究jar的管理。直到接触一些大数据的MapReduce编程,才了解到Maven项目管理。想必要,我就提出了两个疑问。为什么要使用Maven,Maven又是什么呢?Why?我以前写的代码项目只是一些阿猫阿狗的项目,也就是个简易的图书管理系统或成绩管理系统,但是当项目非常庞大时,就不适合用package来划分模块,这个时候就需要每一个模块对应一个工程就有利于协作。...

2019-09-01 20:51:13 196

原创 hive分区表的创建以及代替MR编程

分区表create external table track_info(ip string,country string,province string,city string,url string,time string,page string) partitioned by (day string) ROW FORMAT DELIMITED FIELDS TERMINATE...

2019-08-24 13:49:18 249

原创 Hive外部表在Hive中使用

查看emp表的结构发现这是一个内部表Table Type: MANAGED_TABLE之后在mysql中查看emp2等表的结构删除表:HDFS上的数据部分被删除 & Meta也被删除drop table emp2;创建一张外部表CREATE EXTERNAL TABLE emp_external(empno int,ename string...

2019-08-24 09:48:04 1037

原创 Hive QL执行计划

EXPLAIN SyntaxHive provides an EXPLAIN command that shows the execution plan for a query. The syntax for this statement is as follows:EXPLAIN [EXTENDED|CBO|AST|DEPENDENCY|AUTHORIZATION|LOCKS|VECTORI...

2019-08-24 09:22:04 85

原创 Hive QL之join的使用

首先需要另外加载一个表,实现两张表之间的互相联系CREATE TABLE dept(deptno int,dname string,loc string)ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';加载数据LOAD DATA LOCAL INPATH '/home/hadoop/data/dept.txt' OVERWRITE I...

2019-08-24 09:12:40 187

原创 Hive QL之分组函数

分组函数: group by求每个部门的平均工资select deptno ,avg(sal) from emp group by deptno;出现在select中的字段,如果没有出现在聚合函数里,那么一定要实现在group by里select deptno ,avg(sal) from emp group by deptno;否则语法通不过求每个部门、工作岗位的平均工资sele...

2019-08-24 08:53:48 826

原创 Hive QL之聚合函数

聚合:max/min/sum/avg统计部门编号有多少员工为10select count(1) from emp where deptno=10;select max(sal),min(sal),sum(sal),avg(sal) from emp;

2019-08-24 08:40:45 149

原创 Hive QL基本统计

<font style="vertical-align: inherit;"><font style="vertical-align: inherit;">[WITH CommonTableExpression(,CommonTableExpression)*](注意:仅从Hive 0.13.0开始提供)</font></font><font&...

2019-08-24 08:25:37 154

原创 Hive DML之加载和导出数据

Hive Data Manipulation LanguageHive数据操作语言Loading files into tablesHive does not do any transformation while loading data into tables. Load operations are currently pure copy/move operations that mo...

2019-08-23 23:36:25 211

原创 Hive DDL之表操作

CREATE [TEMPORARY] [EXTERNAL] TABLE [IF NOT EXISTS] [db_name.]table_name -- (Note: TEMPORARY available in Hive 0.14.0 and later)<font></font> [(col_name data_type [COMMENT col_comment...

2019-08-23 22:14:32 296

原创 Hive DDL之数据库操作

DDL:Hive Data Definition LanguageHive数据定义语言CREATE DATABASE/SCHEMA, TABLE, VIEW, FUNCTION, INDEXDROP DATABASE/SCHEMA, TABLE, VIEW, INDEXTRUNCATE TABLEALTER DATABASE/SCHEMA, TABLE, VIEWMSCK REPAI...

2019-08-23 17:37:47 189

原创 hive快速入门

首先需要安装数据库MySQLhttps://www.cnblogs.com/julyme/p/5969626.html之后开启mysql,之前在hive-site.xml里面配置了数据库的用户和密码都是root之后开启hivehive> create database test_db;之后进去MySQLuse hadoop_hive;show tables;可以看...

2019-08-23 15:30:45 194

原创 Hive部署

首先需要到官网上下载与hadoop相对应的hive版本https://archive.cloudera.com/cdh5/cdh/5/之后下载到服务器上进行解压tar -zxvf hive-1.1.0-cdh5.15.tar.gz -C ~/app解压之后如图之后设置系统环境变量之后设置修改后需要source使配置生效source ~/.bash_profile...

2019-08-23 10:46:15 201

原创 Hive与RDBMS的区别

对比Hive关系型数据库查询语言HQLSQL数据存储HDFSRaw Device or Local FS执行器MRExcutor数据插入支持批量导入/单条插入支持单条或者批量导入数据操作覆盖追加行级更新删除执行延迟高小处理数据规模大小分区支持支持扩展性高有限索引0.8版本之后加入简单索...

2019-08-23 10:20:22 266

原创 Hive体系架构

Hive体系架构client(客户端):shell、Thrift(协议)、WebUICommand-line shell:可以直接在命令行上写命令,写完直接提交到Hive引擎上去。Thrift:一种协议需要java代码,通过jdbc提交(thrift/jdbc)(server/jdbc)WebUI(HUE/Zepelin):通过可视化展示metastore:==>MySQLd...

2019-08-23 09:30:41 422

原创 为什么要使用Hive

简单、容易上手为超大数据集设计的计算/扩展能力统一的元数据管理Hive数据存放在HDFS上,元数据信息是存放在Mysql中,元数据{(表名字、表字段、表字段类型、存放在HDFS的位置)记录数据的数据。}SQL on hadoop :Hive、Spark SQL、impala…构建于Apache Hadoop之上,提供以下功能:通过SQL轻松访问数据的工具,从而实现数据仓库任务,如提...

2019-08-23 08:58:34 1547

原创 Hive是什么

Hive概述:由Facebook开源,用于解决海量结构化日志的数据统计问题构建在Hadoop之上的数据仓库Hive提供了SQL查询语言:HQL底层支持多种不同的执行引擎Hive底层支持执行引擎:MR、Tez、SparkThe Apache Hive ™ data warehouse software facilitates reading, writing, and managi...

2019-08-23 08:42:07 441

原创 数据仓库Hive

Hive产生背景MR编程的不便性传统RDBMS人员的需要HDFS上的文件并没有schema的概念表名、字段名称之为schema在传统的MR编程中,就一个简简单单的词频统计案例,需要map、reduce类继承官方的Map、Reduce类,最后还需要java类,来规定文件统计的输入、输出的类型和路径,是非常麻烦的。这就是无形的提高了MR编程的难度。一旦产品经理提出了需求,你就要修改代码...

2019-08-23 08:33:22 93

原创 ETL对数据清洗

ETL描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。有时候面对大量的数据,我们不方便进行计算,这个时候就需要进行相应的维度分析,解析出你需要的字段,去除一些你不需要的字段,然后进行分析package project.mrv2;import com.imooc.bigdata.hadoop.hdfs.mr.project.util...

2019-08-22 17:32:52 5524 5

原创 用MR统计页面浏览量页面编号功能

package project.mr;import com.imooc.bigdata.hadoop.hdfs.mr.project.utils.ContentUtils;import com.imooc.bigdata.hadoop.hdfs.mr.project.utils.LogParser;import org.apache.hadoop.conf.Configuration;i...

2019-08-22 16:37:25 220

原创 页面浏览量统计之页面编号获取

package com.imooc.bigdata.hadoop.hdfs.mr.project.utils;import org.junit.After;import org.junit.Before;import org.junit.Test;import java.util.Map;public class LogParseTest { LogParser logP...

2019-08-22 16:23:14 368

原创 用MR统计省份流量

package project.mr;import com.imooc.bigdata.hadoop.hdfs.mr.project.utils.IPParser;import com.imooc.bigdata.hadoop.hdfs.mr.project.utils.LogParser;import org.apache.commons.lang.StringUtils;import...

2019-08-22 16:21:12 322 3

原创 省份流量统计之日志解析

LogParser.javapackage com.imooc.bigdata.hadoop.hdfs.mr.project.utils;import org.apache.commons.lang.StringUtils;import java.util.HashMap;import java.util.Map;public class LogPaeser { pub...

2019-08-22 11:51:04 719

原创 省份浏览量统计之IP库解析

IPParser.javapackage com.imooc.bigdata.hadoop.hdfs.mr.project.utils;public class IPParser extends IPSeeker { // 地址 仅仅只是在ecplise环境中使用,部署在服务器上,需要先将qqwry.dat放在集群的各个节点某个有读取权限目录, // 然后在这里指定全路径 ...

2019-08-20 22:25:09 419

原创 浏览量统计功能实现

这是代码package project.mr;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.LongWritable;import org.apache.hadoop.io.NullWritable;import org....

2019-08-20 21:52:29 2894 6

Servlet笔记,servlet生命周期、定义

本人学习Servlet的笔记。可以很好区别jsp与Servlet之间的区别

2021-04-09

JSP笔记,本人学习JSP的心得

JSP笔记关于JSP原理、常用语法、看完之后简单的JSP文件代码可以看懂

2021-04-09

Java笔记,本人学习java的心血笔记

本人学习Java过程中的笔记,希望对大家有所帮助

2021-04-07

网络安全与管理知识点总结思维导图.pdf

网络安全体系(物理层、系统层、网络层、应用层、管理层) 网络防御基本技术(信息加密、访问控制、防火墙、入侵检测、恶意代码防范、安全审计与查证),这也是对网络安全的基本措施

2020-09-10

无线网络原理.pdf

可以很好的了解知识结构,本思维导图包括无线网络原理的基本所有知识点,也是亲自总结出来的,知识包括无线网络传输技术 WLAN的MAC层关键技术 WLAN的组建 IEEE802.11协议 WLAN的勘测与规划 WLAN的安装与部署 蓝牙技术与组网 无线MESH技术 MANET路由协议

2020-09-10

trackinfo_20130721.txt.zip

Hadoop电商之ETL对数据的清洗,数据来源经过抽取、转换、加载至目的端的过程,有时候面对大量的数据,我们需要进行维度分析,解析出需要的字段去除一些不需要的字段。

2020-04-30

ip地址解析库结合流量统计值ip地址解析库使用

ip地址的解析库,通过本博客的流量统计之IP库地址解析,输入ip地址进去,就可以得到ip的国家、省份、城市信息

2019-08-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除