自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Cosmic Lover

一起加油

  • 博客(10)
  • 收藏
  • 关注

原创 计算机组成原理:存储结构(一)

文章目录本章结构第一节:预备节——主存储器芯片结构与寻址第二节:半导体存储器:RAM(随机读写存储器)与ROM(只读存储器)本节脑图主存常用的两种芯片比较DRAM的刷新芯片如何工作的ROM(只读存储器)第三节 存储器的一些基本概念存储器的分类性能指标存储器的层次化结构第四节:主存与CPU的连接扩容(主存容量扩展):位扩展扩容:字扩展回忆译码器功能字位同时扩展本章结构第一节:预备节——主存...

2020-04-26 23:32:04 1479

原创 wordcount进化:统计总共单词个数+ 自定义Combiner、 Partioner 类

task1:WordCount统计总共单词个数任务描述wordcount上一次的任务是统计每个单词出现的次数,现在的功能要修改成统计文本中一共有多少个不同的单词。解决思想两个mapreduce的job串联运行,第一个job进行分词和词频统计,第二个job统计共有多少词,job2的map把每行都输出成<sum,1>,reduce任务不做修改,结果即为所求单词总数。具体实现代...

2020-04-26 16:40:58 627

原创 fhh课堂笔记

三元组是目前自然语言处理领域的比较热的方向B(症状上位标志词):特点, 特征,现象,表现,疾病,症状,指标, 重要指标,病症,临床,总称C:伴有,包括,出现 ,是,是种,是一种 ,非一种,反映,还有, ,存在,指的是,可见,以,引起,可, 以…为,并D :无症状,没有…症状,D1:随,通常,有时,偶尔,主要,继而,随后,往往,更为明显,明显,严重,轻微,比…更 ,…时,迅速, 突发,凶猛...

2020-04-24 21:05:09 255

原创 pandas数据分析:剔除数据相同或全为空的列

代码:def dropNullStd(data): beforlen = data.shape[1] colisNull = data.describe().loc['count']==0 #colisNull中1代表该列是空,0代表不为空 for i in range(len(colisNull)): if colisNull[i]: ...

2020-04-14 12:36:40 2692

原创 自定义一个hadoop数据类型

import org.apache.hadoop.io.WritableComparable;import java.io.DataInput;import java.io.DataOutput;import java.io.IOException;public class Point3D implements WritableComparable<Point3D> { ...

2020-04-11 12:09:14 129

原创 MapReduce实例WordCount的编程实现与Hadoop数据类型介绍

目录:Hadoop数据类型介绍WordCount编程实现WordCount部署运行参考Hadoop数据类型介绍我们知道hadoop是由Java 编程写的。因此我们使用Java开发环境来操作HDFS,编写mapreduce也是很自然的事情。但是这里面hadoop却对Java数据类型进行了,那么hadoop的数据类型与Java那些数据类型对应。下面做一些对比:(1) 在hadoop.io包,主要...

2020-04-11 12:02:44 197

原创 MapReduce

介绍MapReduce是一种并行编程模型,计算过程高度抽象成Map和Reduce两个函数,屏蔽了底层细节。MapReduce的策略:分而治之MapReduce的理念计算向数据靠拢。架构Master/slave函数介绍:Reduce函数的输入输出:MR的体系结构组件解释以slot为单位进行资源调度MapReduce的工作流程...

2020-04-05 17:08:25 130

原创 Linux截图

Alt+PrtSc:整个界面截图Shift+PrtSc:选区截图保存到图片Shift+Ctrl+PrtASc:选取截图保存到剪切板(常用)

2020-04-05 15:58:16 126

原创 分布式文件系统 笔记

shell命令风格教材《大数据技术原理与应用》的命令是以”./bin/hadoop dfs”开头的Shell命令方式,实际上有三种shell命令方式。hadoop fshadoop dfshdfs dfshadoop fs适用于任何不同的文件系统,比如本地文件系统和HDFS文件系统hadoop dfs只能适用于HDFS文件系统hdfs dfs跟hadoop dfs的命令作...

2020-04-05 15:48:53 97

原创 上传文件到HDFS报错:There are 0 datanode(s) running and 0 node(s) are excluded in this operation.

上传文件到HDFS的时候报错_COPYING_ could only be written to 0 of the 1 minReplication nodes. There are 0 datanode(s) running and 0 node(s) are excluded in this operation.解决原因似乎是因为datanode没有启动,查了解决方法,最终stakeo...

2020-04-05 15:39:14 2714

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除