- 博客(28)
- 收藏
- 关注
原创 HBase的简单学习四
HBase中的行是按照rowkey的字典顺序排序的,这种设计优化了scan操作,可以将相关的行以及会被一起读取的行存取在临近位置,便于scan。然而糟糕的rowkey设计是热点的源头。热点发生在大量的client直接访问集群的一个或极少数个节点(访问可能是读,写或者其他操作)。大量访问会使热点region所在的单个机器超出自身承受能力,引起性能下降甚至region不可用,这也会影响同一个RegionServer上的其他region,由于主机无法服务其他region的请求。
2024-04-26 14:31:01 867 1
原创 重生之我是Java小白五
object,scanner,String,StringBuffer,Arrays,包装类,Random,System,Data,SimpleDataFarmat
2024-03-11 20:04:39 716
原创 linux基本命令
举例:将master机器上的/usr/local/soft/a1.txt,复制到node1机器上的/usr/local/soft/a1.txt。将当前目录下的xxx.txt 移动到当前目录下,移动后的名字叫做yyy.txt 相当于移动并改名 ,但是之前的xxx.txt还是存在的。将当前目录下的a1.txt 移动到当前目录下aaa目录下,移动后的名字叫做a1.txt,移动后原来的文件没了。将当前目录下的xxx.txt 移动到aaa目录下,移动后的名字叫做yyy.txt 相当于移动并改名。
2024-01-24 17:08:33 883 1
原创 虚拟机的安装以及克隆
1.【金山文档】 VMware-workstation-full-12.0.0-2985596https://kdocs.cn/l/cha8IrXDCRow 我安装的是VMware12.0的取消勾选其他的全是系统默认即可。
2024-01-24 14:21:57 1634
原创 简单爬虫的学习
是一种路径查询语言,简单的说就是利用一个路径表达式从html文档中找到我们需要的数据位置,进而将其写入到本地或者数据库中。(可以将xpath类比为sql结构化查询语言)
2024-01-20 17:10:20 987
原创 numpy的简单学习
运行结果 (array([0, 0, 0, 1, 1, 2, 2, 2, 3, 3, 3], dtype=int64), array([0, 1, 2, 0, 2, 0, 1, 2, 0, 1, 2], dtype=int64))运行结果 [ 2 5 9 12 12 13 15 17 18 20 23 26]#返回的是非0的元素的坐标,第一个结果是行索引,第二个结果是列索引。运行结果 [[2 3 5 1]] #运行结果 (4, 3)#元组形式。运行结果 [[2 1]运行结果 [2 1]
2024-01-18 19:03:51 381
原创 正则表达式
运行结果 [('32012320001231987X', '2000'), ('320123200110059879', '2001')]运行结果 ['15354074069', '183543074069', '173540740699876']运行结果 ['h', 'xh', 'dascuhkk', 'hah', 'x', 'yedqghyw']运行结果 ['da', 'ye', 'dq', 'yw']运行结果 ['hhd', 'hh ', 'hhg']
2024-01-17 20:12:22 892
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人