脸ル粉嘟嘟-CSDN博客

原创 CDH5安装Kerberos认证

BUGBUG写在前面：Kerberos 1.15.1-18.el7.x86_64 版本有BUG,不要安装这个版本!!!!如果已安装上面描述版本不要怕，这里有一篇解决方案升级kerberos1.系统环境1.操作系统：CentOS Linux release 7.5.1804 (Core)2. CDH: 5.16.2-1.cdh5.16.2.p0.83. Kerberos：1.15.1-50.el7x864.采用root用户进行操作2.KDC服务安装及配置2.1.安装KDC服务在Cloude

2021-12-30 11:06:56 1837

原创 Oracle中Drop Table之后想恢复？来看这里[只要二步]

作用范围：下面方法仅仅适用于drop table，如果是delete 表中某些数据之后想要恢复请看这里，只需要三步。准备.查看数据库中，回收站里面存放的表名，以及drop table时的表名select object_name,original_name,type,droptime from user_recyclebin;方法一.根据drop table时删除的表名恢复表以及恢复......

2019-11-22 10:07:12 4512 1

原创 Oracle中Delete数据之后想恢复？来看这里[只要三步]

1.查询数据库当前时间（目的是为了检查数据库时间是否与你电脑时间相近，避免时间不同而将数据恢复到错误时间点）select to_char(sysdate,'yyyy-mm-dd hh24:mi:ss') from dual;2、查询删除数据时间点之前的数据select * from 表名 as of timestamp to_timestamp('2019-11-10 11:00:00',......

2019-11-20 11:37:03 1810

原创 DataX环境部署以及测试案例

DATAX简介DataXDataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台，实现包括 MySQL、SQL Server、Oracle、PostgreSQL、HDFS、Hive、HBase、OTS、ODPS 等各种异构数据源之间高效的数据同步功能。FeaturesDataX本身作为数据同步框架，将不同数据源的同步抽象为从源头数据源读取数据的Reader插件，以及向目标端写入数据......

2019-03-11 17:24:55 5105 2

原创安装CentOS6.8并配置网络图文解说亲测全过程

安装环境：本文是在win10系统安装上VMWare并配置Centos6.8虚拟机。准备工作1.安装VMWare虚拟机1.1下载VMWare12资源链接：https://pan.baidu.com/s/1AhfMSDXLO-aA0eMqnuMWHg 提取码：iftd1.2安装VMWare，在安装过程中需要输入密钥，填写下面密钥即可，傻瓜式安装。5A02H-AU243-TZJ49-GTC7...

2019-01-16 19:27:08 1475

原创 5台机器搭建HA步骤与注意事项

HA是High Available缩写，是双机集群系统简称，指高可用性集群，是保证业务连续性的有效解决方案，一般有两个或两个以上的节点，且分为活动节点及备用节点。

2019-01-15 19:18:40 2637 4

原创 kettle入门之文本文件导入数据库

Kettle是一款国外开源的ETL工具，纯java编写，可以在Windows、Linux、Unix上运行，数据抽取高效稳定。Kettle 中文名称叫水壶，该项目的主程序员MATT 希望把各种数据放到一个壶里，然后以一种指定的格式流出。...

2019-01-01 13:40:58 4489 1

原创使用Java实现发送email邮件

一、maven依赖 <dependency> <groupId>javax.mail</groupId> <artifactId>mail</artifactId> <version>1.4.7</version> </dependency&am...

2018-12-01 17:16:46 1683

原创 kafka使用说明书

首先要打开zookeeper，其次打开kafka，关闭时要先关闭kafka再关闭zookeeper启动zookeeperzookeeper-server-start.sh config/zookeeper.properties启动kafkakafka-server-start.sh config/server.properties停止kafkakafka-server-...

2018-11-29 21:29:50 479

原创 solr部署以及ik中文分词案例

1.简介Solr是一个高性能，采用Java5开发，Solr基于Lucene的全文搜索服务器。同时对其进行了扩展，提供了比Lucene更为丰富的查询语言，同时实现了可配置、可扩展并对查询性能进行了优化，并且提供了一个完善的功能管理界面，是一款非常优秀的全文搜索引擎。因为中文的特殊性，在对中文文档建立全文索引时，需要利用分词工具进行分词。目前比较知名的分词工具有：IK，庖丁等.下面使用的是I...

2018-11-24 16:35:09 301

原创 Java使用PDFBox操作PDF文件获取页码、文章内容、缩略图

一、依赖<dependency> <groupId>com.sleepycat</groupId> <artifactId>......

2018-11-06 22:12:39 6893

原创 hadoop单机伪分布安装HBase-1.4.8详细步骤（亲测成功）

---------前提：安装hadoop、yarn、jdk1.下载解压1.1使用wget下载wget http://archive.apache.org/dist/hbase/1.4.8/hbase-1.4.8-bin.tar.gz 1.2解压到/usr/local目录下tar -zxvf hbase-1.4.8-bin.tar.gzmv hbase-1.4.8 /...

2018-10-23 21:36:10 1899

原创关于Hadoop的杂乱无章（续更）

hadoopJPS（是jdk的工具）：表示查看当前主机有哪些运行的进程NameNode ：表示主节点DataNode：表示数据节点SecondaryNameNode ：表示次要名称节点--节点表示：一台机器进程是运行在机器上的，一个软件可以有多个进程（分布式软件：Hadoop）HDFS只是Hadoop的一部分，Hadoop还有MR、yarnHDFS是分布式软件系统：将文件自动分布...

2018-09-29 19:55:00 1104

原创使用CentOS6.8搭建Hadoop集群

概述：集群cluster，能将很多进程分布到多台计算机上；通过联合使用多台计算机的存储、计算资源完成更庞大的任务。为了实现无限量的存储和计算能力，在生产环境中必须使用集群来满足需求。注意事项：1)集群中的计算机在时间上要同步，系统时间不能差太多（约30秒内），如果设置时间后重启时间又不准确了（可能是主板电池老化），可以启用NTP（Network Time Protocol网络时间...

2018-09-29 09:23:28 2389

原创使用IEDA2018创建maven+web项目

因为是自学，所以走了不少弯路，因此总结一下放置自学的小伙伴们少走弯路,还没有安装IntelliJ IDEA可以点击这里1.版本信息介绍【idea版本】：2018.1.5【Tomcat版本】：7.0.52【maven版本】：3.5.42.软件安装idea的安装与破解可以点击这里Tomcat：安装与启动如下所示运行软件：找到你的tomcat文件路径下的bin(这是我的...

2018-08-15 11:18:23 5233

原创 Idea添加依赖的步骤：

1. 项目按F4(ctrl+shift+alt+s)2. 找到dependencies选项卡3. 点击“ +”4. 将jar包选中，加入5. 可以使用jar中的工具类。网络上下载jar1. 百度搜索 maven repo2. 输入jar包的名字3. 找到对应的版本下载jar...

2018-07-31 11:17:49 13887

原创电脑重生之Windows重装系统（草稿）

下载途径：a.微软官网（没有历史老版本） b.三方网站（itellYou）备份数据，一般只需要格式化系统盘即可，其他盘数据无需备份。苹果电脑：自带的bootcamp助理。作用：备份数据、分盘。

2024-12-13 11:18:56 178

原创 Oracle之自动化部署etl程序

【代码】Oracle之自动化部署etl程序。

2024-12-13 11:04:15 325

原创 python之使用SFTP将Windows文件上传到Linux

【代码】python之使用SFTP将Windows文件上传到Linux。

2024-12-13 11:01:50 402

原创 linux(redhat8)如何安装mysql8.0之rpm&tar双版本（最新版）（内网）（离线）

如果运行命令之后没有出现任何内容，表示没有安装过mysql，如果有出现，则删除。点击下载按钮弹出下图，点击红框中的连接，跳过登录，直接下载。Java环境：build 1.8.0_181-b13。使用下方的命令进行解压，根据实际安装包名称进行修改。#查看内核版本，根据内核版本下载对应的安装包。如图示，选择对应版本进行下载，此处我的选择是。进入MySQL根目录，直接复制粘贴命令即可。系统版本：Red Hat 8.5.0-20。将压缩包上传至要进行安装的服务器。MYSQL：8.x版本。

2024-11-25 10:08:43 1568

原创 JDK升级步骤之纯执行脚本版

【代码】JDK升级步骤之纯执行脚本版。

2024-11-25 09:42:11 232

原创 Jdk和Tomcat安装部署文档

回车，如果看到Tomcat自带的一个JSP页面，说明你的JDK和Tomcat已搭建成功。点击应用，重新启动Tomcat.选择jre的路径，点击Next。，避免与其他服务端口冲突。点击Finish安装完成。打开浏览器，在地址栏中输入。点击关闭，安装完成。，点击Install。

2024-11-25 09:33:18 499

原创 BI之帆软参数多sheet页派邮

【代码】BI之帆软参数多sheet页派邮。

2024-11-25 09:13:04 254

原创 Windows之使用putty软件以ssh的方式连接Linux中文显示乱码

运行环境：Windows10使用软件：putty操作说明：以ssh的方式连接Linux 中文显示乱码。

2024-11-22 17:35:38 447

原创 Linux之NFS共享文件操作

如果成功会列出共享的目录，如下图所示。

2024-11-22 17:13:45 647

原创 GitLab使用操作v1.0

只有项目创建者有权限更新，我们只能更新自己分支，然后创建合并请求，项目管理者合并到master分支）描述格式：2024/07/16 001-master 添加funddc用户中的脚本 v1.0。Url是第三步查看的[使用http克隆]下面的url –>点击[应用]填写指派人、审核人，点击[创建合并请求]，等待请求合并到，时间作者操作类型具体描述版本。本地仓库格式：应于远程仓库名称一致。] ，填写自己的分支名称（自己的分支名称：例如。

2024-11-22 17:04:31 608

原创 python读取Oracle库并生成API返回Json格式

【代码】python读取Oracle库并生成API返回Json格式。

2024-11-19 09:48:05 723

原创 Linux系统中fstab去除cifs明文挂载信息

【代码】Linux系统中fstab去除cifs明文挂载信息。

2024-11-19 09:29:59 451

原创 Python 在人工智能与大数据中的应用

【代码】Python 在人工智能与大数据中的应用。

2024-11-15 14:35:37 463

原创好奇吗？除了A站、B站还有什么

好奇吗？除了A站、B站还有什么。

2024-11-14 16:48:27 4886 1

原创常用命令之Linux&Oracle&Hive&Python

【代码】常用命令之Linux&Oracle&Hive&Python。

2024-11-14 14:28:40 614

原创数仓建设之Oracle常见语法学习

【代码】数仓建设之Oracle常见语法学习。

2024-11-14 13:51:26 759

原创大数据CDP集群中Impala&Hive常见使用语法

【代码】大数据CDP集群中Impala&Hive常见使用语法。

2024-11-14 13:34:10 1174

原创使用python-Spark使用的场景案例具体代码分析

• 日志分析：互联网公司每天会产生海量的服务器日志，如访问日志、应用程序日志等。Spark可以高效地读取这些日志文件，对数据进行清洗（例如去除无效记录、解析日志格式）、转换（例如提取关键信息如用户ID、访问时间、访问页面等）和分析（例如统计页面访问量、用户访问路径等）。• 数据仓库ETL（Extract，Transform，Load）：在构建数据仓库时，需要从各种数据源（如关系型数据库、文件系统等）提取数据，进行清洗、转换和加载到数据仓库中。

2024-11-14 13:11:02 769

原创 python解析网页上的json数据落地到EXCEL

【代码】python解析网页上的json数据落地到EXCEL。

2024-11-14 09:43:12 812

原创使用Python实现对接Hadoop集群（通过Hive）并提供API接口

安装必要的库首先，确保已经安装了以下库：代码实现。

2024-11-14 09:01:36 1253

原创从机缘到成就

在撰写博客和文章的过程中，我不得不不断地学习和探索新的技术，这也让我更加深入地理解了编程的本质和思想。除此之外，我还收获了很多粉丝和读者，他们经常给我反馈和评论，这也让我更加有动力和信心继续创作。我也曾面临挫折和疲惫。我不断学习新的知识和技能，积极参与各类技术研讨会和交流活动，这不仅增加了我对技术的深度理解，也拓宽了我的视野与见识。在这1825天的旅程中，我找到了自己的方向，也收获了许多宝贵的机遇和成长。我的技术博客逐渐积累了一定的粉丝和读者群体，他们通过评论和邮件与我互动，给我提供了更多的反馈和建议。

2023-06-19 17:16:48 311

原创设置linux静态ip

配置的是局域网网络号，这个是。就是网关或者路由地址；需要说明，原来还有个。ifcalc自动计算。

2023-06-17 01:05:20 234

原创如何设置CDH的资源池

【代码】如何设置CDH的资源池。

2023-06-17 00:56:32 446

原创离线计算调优手册

目前离线计算主要分为两块：和，该手册将围绕这两部分展开说明。随着技术不断迭代升级，结合不同业务、不同场景，手册的适用性可能发生变化，因此下面介绍的优化手段可作为参考，并不是一成不变的。Hive的简单定义（来自Hive官网）：简单来说，hive本身是一种数据仓库，通过其提供的sql和访问接口，使我们能够很方便的访问读写大规模数据集，无需关注底层数据是如何分布存储的。目前hive 提供了三种计算引擎：，使用者可根据hadoop集群安装环境（CDH、阿里云EMR等等）选择使用不同的计算引擎。具体可通过参数

2023-06-13 23:23:58 600

FFReader-Win-V1.9.16-64Bit

FFReader是一个通用的强大的接口数据文件解析阅读编辑工具，工具所要解决的问题是程序之间定义的文件批量接口一般使用字段定长，固定分隔符这类形式，开发和日常运营中，直接当作文本阅读数据过于不友善的问题，程序支持Windows/macOS/LInux系统。安全，快速，可编辑，可导出excel，可查找，可列模式显示，可显示翻译枚举字段，本程序目前已广泛的应用在证券基金行业。

2024-11-19

smbMount fstab去除cifs明文挂载信息变更手册

1、拷贝smbMount文件夹至/tmp； 2、root用户执行以下命令 cp /etc/fstab /opt/fstab$(date "+%Y%m%d").bak 3、将脚本文件拷贝目录，可以任意指定一个路径 cp -r /tmp/smbMount /opt/ 4、对脚本赋予执行权限 chmod -R 775 /opt/smbMount 5、编辑/opt/smbMount/mount.ini 将原来在/etc/fstab里面的cifs挂载信息进行配置 6、赋权 chmod a+x /etc/rc.d/rc.local赋予执行权限 7、开机自启 cat /etc/rc.local|grep "smbMount">/dev/null||echo "/opt/smbMount/smbMount">>/etc/rc.local 8、卸载映射盘，执行/opt/smbMount/smbMount，查看mount.ini文件内的配置项的密码是否都被加密，且encrypt项是否都是1（验证开机自启） 9、检查映射盘

2024-11-18

dbf2csv.rar

dbf2csv路径下有一个【示例.txt】1.修改里面的路径位置（E:\luyz03）、2.把此文本文件的扩展名改为bat。（即将txt改为bat，此文本文件随即变为批处理文件）然后双击此文件，执行刚输入在文本文件里的命令，就会批量的将（file文件夹下面）的DBF文件转化成CSV文件。

2019-07-25

MobaXterm是Windows全能终端神器

MobaXterm提供了大量为程序员，网站管理员，IT管理员以及几乎所有需要以更简单的方式处理远程作业的用户量身打造的功能。它不仅支持各种连接和Unix命令，还可以像PuTTY一样通过SSH连接Raspberry Pi等开源硬件。

2018-10-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人