自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 双显示器扩展显示自定义鼠标移入方向

双显示器、扩展显示器、鼠标跨屏问题、鼠标移入方面

2023-03-02 15:20:13 44

原创 批量修改mysql数据库、表、字段的编码格式及排序规则

批量修改mysql数据库、表及字段的编码格式及排序规则

2023-01-11 09:25:29 175

原创 SFTP批量下载与中文文件名乱码问题

sftp批量拉取服务器文件,文件名乱码处理

2022-11-29 14:58:28 257

原创 一个专业搬砖人的幻想:全国实现旬休制度

旬休制的幻想设计

2022-10-12 17:42:12 222

原创 virtualbox:win11上的deepin如何设置与宿主机共享文件

virtualbox虚拟机实现window与deeplin/linux文件共享

2022-06-24 13:07:49 445

原创 virtualbox: win11主机安装deepin双向复制问题

virtualbox在windows11上安装深度系统deepin双向复制问题处理

2022-06-23 23:28:21 473

原创 58同城面试盘点

58同城面试盘点1.一张订单表,有user_name,order_id,order_time,order_amount 四个字段,怎么取出每个用户2021年10月以来第一个订单的金额(下单时间格式为’yyyy-MM-dd HH:mm:ss’)?select user_name, order_id, order_amountfrom( select user_name, order_id, order_amount, row_number() over(partition by use

2022-02-21 23:41:36 839

原创 HIVE 数据倾斜浅谈

HIVE 数据倾斜浅谈

2022-02-20 23:28:48 557

原创 HIVE 优化浅谈

HIVE 优化浅谈hive不怕数据量大,导致运行慢的主要原因是数据倾斜。hive的运行机制这里就不再赘述,咱们直入正题,聊一下hive的优化方法。优化点一:业务逻辑优化1.去除冗余逻辑对于复杂业务逻辑来说,在非数据倾斜的情况下,最有效的优化方式就是对业务逻辑的优化,去掉冗余的逻辑过程,能一步完成的不要分两步。尤其对于旧逻辑优化及数据迁移工作中较为常见。2.重复逻辑落临时表复杂的业务场景很可能会有复用的逻辑,把重复的逻辑落入临时表中不仅能减少资源消耗,还能有利于后期的代码维护。优化点二:减少读取

2022-02-16 01:47:12 497

原创 hive UDF函数取最新分区

hive UDF函数取最新分区1.pom文件<dependencies> <!-- https://mvnrepository.com/artifact/org.apache.hive/hive-exec --> <dependency> <groupId>org.apache.hive</groupId> <artifactId>hive-exec</artifactId>

2021-10-13 22:13:59 398

原创 (一)MySQL优化之索引优化

一、索引的概念我们知道,在查询过程中,如果被查询的表没有索引,数据库会进行全表扫描,而如果添加了相应的索引,数据库会根据索引直接查找符合条件的数据。因此,索引的存在会大大提高查询效率。而索引其实就是一个特殊文件(InnoDB中索引是表空间的一部分),它包含碰上对表中所有记录的引用指针。二、索引的分类索引可以分为两种:聚簇索引和非聚簇索引。(一)聚簇索引聚簇索引是按照每张表的主键构造一颗B+树,同时叶子节点中存放的就是整张表的行记录数据,也将聚集索引的叶子节点称为数据页。这个特性决定了索引组织表中数

2020-11-20 01:00:34 138 2

原创 从mysql到大数据(三)--mysql数据库建模一常用数据类型及引擎

数据库的安装请自行百度。如果你想直捣黄龙练查询,没有表没有数据是不能实现的。我们从建表开始学习。但要知道,我们所有东西都是了解,学习不要有压力,不要必须要求记什么,当然,如果你不累可以记,记不住也没关系,练多了,就这几个词,我们也会计住的。从这节开始,我结尾会总结一下本节常用关键词。建表之前,我们要首先学习数据类型。因为,我们的数据要写入表格中进行高效管理就要分一下类。一、常见数据类型我给大家一组对话,大家看看这里面的文字可以分为哪些类:小明同学在2020-10-23 12:30:00吃完了2个馒

2020-10-23 01:41:37 395

原创 从mysql到大数据(二)--数据库的认识

一、数据库的认识数据库顾名思义,是存放数据的库房。二、数据库的分类(了解)可以分为两大类:关系型数据库和非关系型数据库。关系型数据库:关系型数据库,存储的格式可以直观地反映实体间的关系。关系型数据库和常见的表格比较相似,一条记录内的数据彼此之间存在关系。在轻量或者小型的应用中,使用不同的关系型数据库对系统的性能影响不大,但是在构建大型应用时,则需要根据应用的业务需求和性能需求,选择合适的关系型数据库。mysqlOracleMariaDBPercona ServerPostgreSQL

2020-10-23 00:06:37 194

原创 从mysql到大数据(一)--开宗明义

一、大数据长什么样长像很普通,至少看两眼后就觉得很平常。举个栗子:一个表格,学生信息表,里面有学号、姓名、性别、年龄、学校、学院、专业、年级、宿舍号等信息如下,但是表在库里,我们想看,跟现实中的表格的唯一区别是,我们不能用手直接拿。那怎么看呢?借助命令–sql-- 查询四年级学生的学号、姓名、性别、年龄、学校、学院、专业、年级SELECT -- 查询 STU_NO,

2020-10-22 22:16:29 104

原创 SQL优化之浅见

SQL优化之浅见一、查询优化二、导入数据时的优化三、INSERT优化用了段mysql/Oracle/hive等数据库,对SQL语言以Mysql为例,总结一下对sql优化方面的见解,欢迎大家补充。一、查询优化1.在关联查询中,关联键的数据类型一定要相同,最常见的是字符串类型的数字被当作INT类型与INT类型的键进行关联,隐性类型转换会使性能受到很大影响。2.模糊查询使用LIKE时尽量不使用左侧模糊,比如“%其实也厉害”,“%其实%”,不如使用右侧模糊查询,如:“软辅其实也%”;3.在关联或者WHER

2020-09-12 00:44:43 103

原创 动态分区添加的新字段无法插入数据

我们在使用动态分区的进程中,有时候需要新增字段,新增之后,发现该字段一直为空,无论怎么插入数据,该字段值始终不变。过去的做法就是把表删了,重建带新字段的新表,问题就解决了,今天尝试了一种新的方法,也完美解决了这个问题。ALTER TABLE table_name [PARTITION partition_spec] CHANGE [COLUMN] col_old_name col_new_nam...

2019-12-30 00:43:20 700

原创 Error during job, obtaining debugging information...

今天在插入数据的时候出现错误:Error during job, obtaining debugging information…Ended Job = job_1575898012755_0005 with errors Error during job, obtaining debugging information... Examining task ID: task_1575898012...

2019-12-28 02:03:57 4625

原创 mysql/sqlyog导入txt文件的方法

今天尝试着用sqlyog向mysql中导入数据,用了以下几种:一、sql载入格式:LOAD DATA LOCAL INFILE '文件路径'INTO TABLE 表名FIELDS TERMINATED BY '字段分隔符'LINES TERMINATED BY '行分隔符';直接进去了代码:LOAD DATA LOCAL INFILE 'C:\\Users\\Administr...

2019-12-09 23:30:02 4515

原创 开窗函数的意义与用法

开窗函数——排序函数开窗函数与其他函数的区别是,它不是关联其他表查询,而是在一张表内根据我们的想法自定义的规则分组后对我们组内的数据进行检索和计算。我们自定义的规则所分的组,就如同整张表的一个个小窗口,因此我们开出一个个小窗口并对这些小窗口进行的操作就叫做开窗函数。开窗函数分为排序函数和聚合函数。一、排序函数:1.三个排序函数句型:row_number()的排序函数order_func...

2019-10-28 00:06:34 2794

原创 hive中导入text文件遇到的坑

今天帮一同学导入一个excel数据,我把excel保存为txt格式,然后建表导入,失败!分隔符格式不匹配,无法导入!!!!怎么看两边都是\t,怎么不匹配呢?做为程序员,最不怕的就是失败,因为我们有一颗勇敢的心!再来!又特么失败。。。想了好久,看看了看我的表格式,我犯了一个好低级的错误:hive表的存储格式设置为了orcfile!!!众所周知:orcfile为压缩格式,可以节约大量存储空间,...

2019-07-19 02:24:35 2593 5

原创 sqoop导入hive时间格式问题解决方案

sqoop导入hive时间格式问题解决方案从mysql导入数据时,发现时间格式有问题,要么是时间后面多一位零,要么要使用时间戳,还能不能好好玩耍了?!于是,我就逛论坛,找大神,最终无果,也许这个问题过于简单吧,居然没有大牛讨论。想了好几天,也看了sqoop官网,突然灵光一闪,我怎么不去看看mysql官网呢?于是,最终解决方案渐渐揭开了神秘的面纱~~~~~首先,我们复习一下:1. mysql...

2019-07-17 01:48:03 2981

原创 # hive打不开,提示节点过少,进入安全模式~~

hive打不开,提示节点过少,进入安全模式~~前段时候给电及除尘,因为经常拆着玩,越熟练越容易大意,一下子把电源排线扯坏了。挼了挼,想凑和着用吧,没想到不知怎么的就会关机,太频繁了。一怒之下取出来剪了!!!然后没得玩了。去某宝买了个6P排线,2.5,邮费8块。安上发现没网,把路由拆了。一拆网就好,安上就残,重复50次后,把盖揭扔了,它就老实了。然后打开hive,困倦的我又来了精神,居然打不开...

2019-07-16 01:09:24 824

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除