自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 Notepad++插件安装

首先我的notepad++是32位的,去github上下载的插件多为64位和86位。所以可以去官网下载。网址: https://sourceforge.net/projects/npp-plugins/files找到file,找到自己想要的插件,选择版本下载,以XMLtools为例 下载好,解压。 其中install.txt是英文的安装说明。此XMLtools的安装步骤:先去notepad++文件夹下找到plugins,在里面创建一个和xmltools下的.dll文件一样名称的文件夹;

2022-07-01 15:31:50 4115 1

原创 hive 解析json字符串

例如字段 这种是标准的一个json。这种最简单的,用get_json_object把标准json串可以直接按照key-value的形式直接取出,给个别名放一列就行了。不是标准json可以转化成标准。例如:如果是json组,{'a':'1','b':'2'},{'c':'3','d':'4'},用替换函数把 },{ 替换成 , ,转换成标准格式。...

2022-06-29 15:52:23 1249

原创 正则使用记录

15位身份证号:^[1-9]\d{5}\d{2}((0[1-9])|(10|11|12))(([0-2][1-9])|10|20|30|31)\d{2}[0-9Xx]$18位身份证号:^[1-9]\d{5}(18|19|([23]\d))\d{2}((0[1-9])|(10|11|12))(([0-2][1-9])|10|20|30|31)\d{3}[0-9Xx]$

2022-06-23 18:06:17 261

原创 Hadoop实用工具学习总结

Hadoop实用工具学习总结

2022-05-30 15:14:55 211

原创 hadoop生态圈学习总结

hadoop生态圈学习总结

2022-05-30 15:13:59 266

原创 hadoop组件学习总结

hadoop组件总结

2022-05-30 15:13:00 158

原创 1、Linux和shell编程学习总结

Linux和shell编程学习总结

2022-05-30 15:11:59 164

原创 odps TRANS_ARRAY 列一行转多行

odps函数trans_array根据分隔符列数据一行转多行

2022-02-10 15:15:45 3257 1

原创 lateral view、explode,一行转多行

例如数据长这个样子id name value 1 张三 1,2,3 2 李四 4,5,6,7 想要这个样子id name value 1 张三 1 1 张三 2 1 张三 3 2 李四 4 2 李四 5 2 李四 6 2 李四 7 实现:select id,name, single_valuefrom tablelate

2021-09-24 17:54:52 266

原创 excel VLOOKUP函数

转:https://www.zhihu.com/question/27224727

2021-01-15 15:07:51 89

原创 Hue搭建

Hue概述Hue是开源的Apache Hadoop UI系统(HUE=HadoopUser Experience),最早是由Cloudera Desktop演化而来,由Cloudera贡献给开源社区,它是基于Python Web框架Django实现的。通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据,例如操作HDFS上的数据,运行MapReduce Job等等。Hue所支持的功能特性集合:1.认基于轻量级sqlite数据库管理会话数据,用户认证和授权,可以自定义更改

2021-01-07 09:49:54 529

原创 python 爬虫 豆瓣Top250电影信息

# -*- codeing = utf-8 -*-# @Time : timefrom bs4 import BeautifulSoup # 网页解析,获取数据import re # 正则表达式,进行文字匹配import urllib.request, urllib.error # 指定url,获取网页数据import xlwt # 进行excel操作import sqlite3 # 进行SqlLite数据库操作P = re.compile(r'<p class=""&.

2021-01-06 18:44:53 366

原创 java 随机人名 随机字符串

随即字符串:RandomStringUtils.randomAlphanumeric(10);括号里是随机字符串长度随机人名:import java.io.UnsupportedEncodingException;import java.util.Random;public class randomName { public static String getChineseFamilyName(){ String str = null; ..

2020-12-28 10:29:24 257

原创 hadoop2.7 HA 搭建

转:https://blog.csdn.net/lichenglong33/article/details/103388875

2020-12-25 14:16:38 76

原创 vmwareworkstation15player克隆

转载:https://blog.csdn.net/weixin_44324669/article/details/104740466

2020-12-16 16:55:16 163

原创 前(后)中序求后(前)序

#include &lt;iostream&gt;#include &lt;fstream&gt;#include &lt;string&gt;#include &lt;bits/stdc++.h&gt;struct TreeNode { struct TreeNode* left; struct TreeNode* right; char  elem;} T;TreeNode *BinaryTr...

2018-06-07 21:00:31 211

原创 图的最小生成树

#include&lt;bits/stdc++.h&gt;int edge[1005][1005];//用邻接矩阵表示的图int book[1005];//已确定的节点集合int dis[1005];//最短路径int shor[1005];//进入树的点的上一个点int num=0;//节点的总个数int prim(int s) {    int pos, min;//pos记录每次确定下来要加...

2018-06-07 18:25:25 216

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除