自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

u012321968的博客

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月 02月

原创 Qt报错：qt.qpa.plugin: Could not find the Qt platform plugin “windows“ in ““

1.安装pyside2pip install -U pyside2 -i https://pypi.doubanio.com/simple2.在环境变量中添加变量名：QT_QPA_PLATFORM_PLUGIN_PATH变量值：D:\Anaconda3\Lib\site-packages\PySide2\plugins3.注销重新登录windows系统4.打开相关编译器的cmdwin键+scd /d 你的exe所在目录windeployqt xxxxxxx.exe重新运行即可

2020-08-29 11:36:02 3739

转载解决 Qt 对象跨线程调用问题

Qt有很多IO相关的类，比如说QTcpSocket、QFile，总的来说，在Qt的框架内使用，还是非常方便的。但是用过其他框架IO类的人，可能有一个很不习惯，就是Qt的所有IO类，都不推荐或者不可以跨线程操作，不然就会报错，比如说操作QTcpSocket跨线程调用write接口，就会报错：socket notifiers cannot be enabled from another thread要解决这个问题，直观的说就是不要跨线程操作，网上也有很多类似的说明。这也是有道理的，很多时候真的是设计问

2020-08-25 10:09:57 6387

原创 Kafka 基础入门

消息队列的两种模式（1）点对点模式（一对一，消费者主动拉取数据，消息收到后消息清除）消息生产者生产消息发送到Queue中，然后消息消费者从Queue中取出并且消费消息。消息被消费以后，queue中不再有存储，所以消息消费者不可能消费到已经被消费的消息。Queue支持存在多个消费者，但是对一个消息而言，只会有一个消费者可以消费。（2）发布/订阅模式（一对多，消费者消费数据之后不会清除消息）消息生产者（发布）将消息发布到topic中，同时有多个消息消费者（订阅）消费该消息。和点对点方式不同，发布到t

2020-08-24 10:57:40 149

原创 JAVA 操作 Kafka

IDEAPom文件<?xml version="1.0" encoding="UTF-8"?><project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache

2020-08-23 14:17:17 104

原创集群分发脚本

scp（secure copy）安全拷贝（1）scp定义：scp可以实现服务器与服务器之间的数据拷贝。（from server1 to server2）（2）基本语法scp -r $pdir/$fname $user@hadoop$host:$pdir/$fname命令递归要拷贝的文件路径/名称目的用户@主机:目的路径/名称注意：如果目标目录不存在，直接将源test放到opt目录下scp -r test/ root@hadoop

2020-08-21 11:32:55 276

原创 Hadoop HA 高可用

HA概述所谓HA（High Available），即高可用（7*24小时不中断服务）。实现高可用最关键的策略是消除单点故障。HA严格来说应该分成各个组件的HA机制：HDFS的HA和YARN的HA。Hadoop2.0之前，在HDFS集群中NameNode存在单点故障（SPOF）。NameNode主要在以下两个方面影响HDFS集群（1）NameNode机器发生意外，如宕机，集群将无法使用，直到管理员重启（2）NameNode机器需要升级，包括软件、硬件升级，此时集群也将无法使用HDFS HA功能

2020-08-20 10:43:11 194

原创 ZooKeeper 入门

特点数据结构把节点看做是一个目录应用场景提供的服务包括：统一命名服务、统一配置管理、统一集群管理、服务器节点动态上下线、软负载均衡等。本地安装部署1.安装JDK2.下载Zookeeper安装包，解压到指定目录下3.配置修改(1)将/opt/module/zookeeper-3.4.10/conf这个路径下的zoo_sample.cfg修改为zoo.cfgmv zoo_sample.cfg zoo.cfg(2)修改dataDirdataDir=/opt/module/zookee

2020-08-17 22:29:23 402

原创 Qt中使用MSVC编译器通过调用QProcess来执行python代码时This application failed to start because it could not find......

说明现在做的Qt项目（用C++写）中需要调用Python文件，所以通过QProcess来调用。之前是使用MinGW编译器编译程序的，通过QProcess来调用.py文件没问题。今天有特殊需要，要换成msvc2017编译器，在调用Python文件的时候提示：解决办法pip install PyQt5 -i https://pypi.tuna.tsinghua.edu.cn/simple/pip install pyqt5-tools -i https://pypi.tuna.tsinghua.e

2020-08-13 13:57:05 300

转载 Windows使用MSVC编译Mongodb C/C++ Driver

C语言版驱动https://www.cnblogs.com/music-liang/p/12779013.htmlC++语言版驱动https://www.cnblogs.com/music-liang/p/12780094.html

2020-08-12 17:19:06 224

原创 Windows使用MinGW编译Mongodb C/C++ Driver

准备工作1.下载mongo-c-driver，地址：https://github.com/mongodb/mongo-c-driver/releases。我选择的是1.15.3版本的。2.下载mongo-cxx-driver，地址： https://github.com/mongodb/mongo-cxx-driver/releases。我选择的是r3.5.0版本的。3.下载安装msys2，地址：msys2.github.io。选择x86_64 版本, 非 i686.4.进入msys2的安装目录

2020-08-12 17:11:29 837

原创 MapReduce - 压缩

压缩位置的选择压缩参数配置要在Hadoop中启用压缩，可以配置如下参数：

2020-08-09 20:14:09 114

原创 MapReduce - 计数器与数据清洗

计数器数据清洗一般是在map阶段，对输入的数据进行一些合法性检查。对于不合法的数据，在map函数中直接return，合法的才继续走下去。

2020-08-09 18:10:23 90

原创 MapReduce - Map Join 案例

数据基于https://blog.csdn.net/u012321968/article/details/107863294使用场景Map Join适用于一张表十分小、一张表很大的场景。优点思考：在Reduce端处理过多的表，非常容易产生数据倾斜。怎么办？在Map端缓存多张表，提前处理业务逻辑，这样增加Map端业务，减少Reduce端数据的压力，尽可能的减少数据倾斜。具体办法：采用DistributedCache（1）在Mapper的setup阶段，将文件读取到缓存集合中。（2）在驱动函数中

2020-08-09 15:15:22 150

原创 MapReduce - Reduce Join 案例

Reduce Join工作原理Reduce Join案例实操2．需求分析通过将关联条件作为Map输出的key，将两表满足Join条件的数据并携带数据所来源的文件信息，发往同一个ReduceTask，在Reduce中进行数据的串联相关代码TableBean.javapackage MapReduceJoin;import org.apache.hadoop.io.Writable;import org.apache.hadoop.io.WritableComparator;impo

2020-08-07 15:30:45 531 1

原创 MapReduce自定义OutputFormat

3.驱动类中job.setOutputFormatClass(MyOutputFormat.class);注意自定义了OutputFormat，那么在Driver中也要FileOutputFormat.setOutputPath指定输出路径，因为MapReduce本身还要输出一些额外的文件，如crc文件相关代码（以WordCount为例）MyOutputFormat.javapackage MapReduceCustomOutputFormat;import org.apache.hadoo.

2020-08-07 11:12:54 246

原创 MapReduce中一次reduce方法的调用中key的值不断变化分析及源码解析

结合GroupingComparator的例子来说明输入源数据从左到右依次为订单id，商品编号和商品价格需求：输出每个订单中价格最高的商品思路：1.在map之前的排序规则：订单号不同时按字典排序，订单号相同时按价格降序2.在reduce分组排序时，只要订单号相同就认为是相同的key，遍历迭代器的时候只取第一个相关代码OrderBean.javapackage MapReduceGroupComparator;import org.apache.hadoop.io.WritableCo

2020-08-07 10:44:37 488

原创 MapReduce自定义排序案例

数据来源基于Hadoop序列化小例子[统计手机的上行流量，下行流量，总流量]MapReduce排序在Shuffle阶段，在分区之后，排序时根据key值默认按字典顺序进行排序，排序方法为快速排序。基于上述案例的自定义排序原理FlowBean对象做为key传输，需要实现WritableComparable接口重写compareTo方法，就可以实现排序。相关代码FlowBean.javapackage MapReduceFlow;import org.apache.hadoop.io.Wri

2020-08-06 00:04:45 335

原创 MapReduce自定义分区

分区分区的工作发生在Shuffle阶段，即map之后reduce之前。自定义分区步骤相关代码package MapReduceFlow;import org.apache.hadoop.io.Text;import org.apache.hadoop.mapreduce.Partitioner;public class MyPartitioner extends Partitioner<Text,FlowBean> { @Override public in

2020-08-05 23:30:57 538

原创 MapReduce自定义InputFormat小例子

模拟小需求对多个小文件进行读取，设置不可切片，传给map方法得key为小文件的完整路径，value为整个小文件的内容。输出的时候合并成一个SequenceFile文件（SequenceFile文件是Hadoop用来存储二进制形式的key-value对的文件格式），SequenceFile里面存储着多个文件，存储的形式为文件路径+名称为key，文件内容为value。自定义步骤RecordReader是在map之前调用，负责给map函数传key和value值相关代码CustomInputForma

2020-08-05 22:36:08 211

原创初探MapReduce切片

MapTask并行度决定机制数据块：Block是HDFS物理上把数据分成一块一块。数据切片：数据切片只是在逻辑上对输入进行分片，并不会在磁盘上将其切分成片进行存储。数据切片与MapTask并行度决定机制注意第4小点：切片时是逐个针对每一个文件单独切片Job提交流程FileInputFormat源码分析FileInputFormat切片机制CombineTextInputFormat1、应用场景：CombineTextInputFormat用于小文件过多的场景，它可以将多个小文件从

2020-08-05 22:28:24 491

原创 Hadoop序列化小例子[统计手机的上行流量，下行流量，总流量]

原始数据随便生成的模拟数据flowbean.txt手机号 IP地址上行流量下行流量网络代码13345734563 192.168.1.1 1116 3452 20013545734556 192.168.1.1 1126 252 20013545734345 192.168.1.1 34516 3362 20013575734574 192.168.1.1 1886 3642 20018945734596 192.168.1

2020-08-05 14:26:38 577

原创在Hadoop集群中运行自己写的JAVA代码

将JAVA源代码生成jar包1.maven的pom文件中加入以下依赖<build> <plugins> <plugin> <artifactId>maven-compiler-plugin</artifactId> <version>2.3.2</version> <configu

2020-08-05 10:49:09 788

原创 PLSQL编程语言学习笔记

变量的定义1.先从小例子入门：declare i number(2) := 10; s varchar(10) := 'Guapi';begin dbms_output.put_line(i); dbms_output.put_line(s);end;体会一下方法的声明，变量的定义和初始化，如何打印输出2.直接引用某个表中的字段类型：表名.字段名%type，为引用变量，如ena = emp.ename%type;3.另外一种给变量赋值的方法：在select的时候使用in

2020-08-03 11:18:40 316

原创初识Oracle Goldengate源数据库和目标数据库配置

说明源端和目标端都是运行在Centos7上的Oracle11准备工作1.安装好Oracle 11 g2.下载goldengate网址1：http://www.oracle.com/technetwork/middleware/goldengate/downloads/index.html网址2：edelivery.oracle.com3.下载goldengate后解压，我解压到/home/oracle/goldengate11.2.1.0.3/ogg打开数据库最小附加日志SQL>se

2020-08-03 00:11:34 1085

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除