Hadoop 概念 环境搭建 启动 测试 Hadoop 概念1.Hadoop是什么? 广义:Hadoop生态圈的代名词 狭义:Apache 软件基金会下用Java 语言开发的一个开源分布式计算平台 2.Hadoop发展历史 来源:2005年,Hadoop作为Lucene子项目Nutch的一部分正式被引入Apache基金会,随后又从Nutch中剥离,成为一套完整独立的软件,起名为Hadoop。 Lucene 是 Doug Cutting 使用 Java 编写开源软件,Lucene 其实是一个搜索引擎。 2003
java object类 常用方法 &String类 及常用方法 Java Object 类Java Object 类是所有类的父类,也就是说 Java 的所有类都继承了 Object,子类可以使用 Object 的所有方法。Object 类位于 java.lang 包中,编译时会自动导入,我们创建一个类时,如果没有明确继承一个父类,那么它就会自动继承 Object,成为 Object 的子类。类的常用重要方法public String toString()返回对象的字符串表示形式举例:public class Test { public sta
字符编码,你真的懂了吗? 为什么要使用字符编码众所周知我们计算机最开始发起于英文世界的,为了让计算机能够识别所谓的英文字母,诞生了ASCII码,它是一种七位的二进制编码(2^7=128,128种字符足够表示)对于一个字节有八位也即有256种表达从00000000-11111111每种表达对应一种符号,表示英文字符集绰绰有余,所以通常将字节第一位取为0,也即 2 ^ 7 = 128。随着计算机应用的越来越广泛,越来越多的国家也需要有一种能表示自己国家语言属性的字符编码,为了扩充ASCII编码,以用于显示本国的语言,不同的国家和地
计算机编制方式理解?按字编址和按字节编址? 32位计算比机,对一个256M的内存进行编址以便CPU能够使用它,通常我们多种编址方式:按字编址: 对于这个256M内存来说,它的寻址范围是64M,而每个内存地址可以存储32bit数据。按半字编址:对于这个256M内存来说,它的寻址范围是128M,而每个内存地址可以存储16bit数据。按字节编址:对于这个256M内存来说,它的寻址范围是256M,而每个内存地址可以存储8bit数据。地址的概念:存储器被划分成若干单元(小房间)。从0号单元开始编号。这些编号就可以看作地址(房间号)。寻址的概念:
字、字节、字长、存储单元、bit、byte的关系 位、字节、字(bits, Bytes, words)是计算机数据存储的单位。位是最小的存储单位,每一个位存储一个1位的二进制码(0 or 1),一个字节由8位(8个二进制0 or 1 串)组成。而字通常为16、32或64个位组成。位位是最基本的概念,在计算机中,由于只有逻辑0和逻辑1的存在,因此很多东西、动作、数字都要表示为一串二进制的字码例如: 1001 0000 1101等等。其中每一个逻辑0或者1便是一个位,是电子计算机中最小的数据单位。每一位的状态只能是0或1。字节Byte,是由八个位组成的
万字操作系统总结 操作系统总结什么是操作系统操作系统简述操作系统的目标和作用操作系统的发展过程操作系统的基本特性操作系统的主要功能一级目录一级目录一级目录一级目录一级目录什么是操作系统操作系统简述操作系统(Operating System,简称OS)是管理计算机硬件与软件资源的计算机程序。我们都知道,一台普通的计算机系统是由硬件和软件组成的。我们现代计算机硬件系统一般主要由中央处理器、存储器、输入输出控制系统和各种外部设备组成。软件系统一般由系统软件(操作系统,语言编译程序,网络通讯管理系统)应用软件(办公软件,游
python实现01背包 不同解法 问题:4个物品,其重量分别为1,3,5,7,其价值分别为2,4,6,8 背包容量为10,0 1背包求解:贪心:import timew=[1,3,5,7]v=[2,4,6,8]n=4allw=10begin=time.time()s=sorted(list(zip(w,v)),reverse=True)bestv=0res=[0]*4for i in range(4): if s[i][0]<allw: bestv+=s[i][1] res
python常见算法的实现 常见算法-python实现总结排序:1.堆排序:1.创建一个堆:2.获取堆的最大或最小值:3.实现堆排序算法:2.简单选择排序:3.冒泡排序:4.冒泡排序plus:5.归并排序:查找:1.顺序查找:2.折半查找:常见算法:排序:1.堆排序:堆是一种特殊的数据结构,它的通常的表示是它的根结点的值最大或者是最小。python标准库模块heapq提供了相关堆排序的实现heapq的常见用法heapq=[] #创建一个堆heapq.heappush(heap,item)#往堆中插入一条新的值heapq
python re库的贪婪匹配和最小匹配 举例:import rem=re.search(r'PY.*N','PYANBNCNDN')m.group(0)我们用re库中的search函数进行匹配,表示匹配以PY开头,以N结尾,中间可以有若干字符串的字符串。我们匹配的目标是字符串PYANBNCNDN从这串字符串里我们可以看到其中包含多项匹配项,长度不一,有PYAN;PYANBN;PYANBNCN;PYANBNCNDN;那我们究...
回溯算法(以解决n皇后问题为例) 基本思想:回溯算法的基本思想是:从一条路往前走,能进则进,不能进则退回来,换一条路再试。八皇后问题就是回溯算法的典型,第一步按照顺序放一个皇后,然后第二步符合要求放第2个皇后,如果没有位置符合要求,那么就要改变第一个皇后的位置,重新放第2个皇后的位置,直到找到符合条件的位置就可以了。是一种以深度优先搜索带以跳跃性的算法摸索。回溯算法说白了就是穷举法,只不过在进行穷举的过程中,用剪枝函数跳过了一...
解决访问GitHub慢问题 解决方法:修改host文件、首先:访问网址 http://github.com.ipaddress.com/,分别获取github.com、github.global.ssl.fastly.net对应的IP。然后:windows下:找到位于C:\Windows\System32\drivers\etc 下的hosts文件将以下查到的ip保存到hosts里面140.82.114....
python 爬虫入门:爬取彼岸桌面美食壁纸附源码 需求分析进入彼岸桌面网里面,爬取妹子分类里面的壁纸实现:首先我们进入网页,分析妹子网页所在页第一页http://www.netbian.com/meinv/index.htm可以发现图片url都保存在 < img src=“http://img.netbian.com/file/2020/0315/small5967a95623959395d7e0cda3849...
AttributeError: 'set' object has no attribute 'items' 问题 出现AttributeError: ‘set’ object has no attribute 'items’这个问题一般就是写爬虫是headers 定义有问题错误格式:headers = { 'User-Agent : Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) C...
python 3.x 使用urllib2的问题 在我们python3.x 下去安装urllib2会发现,我们并不能找到包,这是因为在python 3.X中urllib2被替换成了urllib.request区别用法主要替换为如下:python2中:import urllib2req =urllib2.Request('xxx')data =urllib2.urlopen(req).read()python3中:import ur...
力扣数据库-177.第N高的薪水 题目:编写一个 SQL 查询,获取 Employee 表中第 n 高的薪水(Salary)。±—±-------+| Id | Salary |±—±-------+| 1 | 100 || 2 | 200 || 3 | 300 |±—±-------+例如上述 Employee 表,n = 2 时,应返回第二高的薪水 200。如果不存在第 n 高的薪水,...
力扣数据库-176.第二高的薪水 原题:编写一个 SQL 查询,获取 Employee 表中第二高的薪水(Salary) 。±—±-------+| Id | Salary |±—±-------+| 1 | 100 || 2 | 200 || 3 | 300 |±—±-------+例如上述 Employee 表,SQL查询应该返回 200 作为第二高的薪水。如果不存在第二高的薪水,那么...