李夏晗很好-CSDN博客

原创大数据组件下载

大数据组件下载命令：wget https://********************************所有大数据组件地址：https://archive.apache.org/dist/

2022-04-25 16:44:22 1753

原创 dataX 传输数据之-----（mysql---＞adb）

dataX 传输数据之-----（mysql—>adb）这个使用"column"是指定要哪些字段必须和 "table"一起使用{ "job": { "setting": { "speed": { "channel": 3 }, "errorLimit": { "record": 0, "percentage

2022-04-20 14:24:50 672

原创 dataX里面的数据源里面的ADS是阿里的AnalyticDBMySQL

今天了解了一下阿里的AnalyticDB MySQL。主要是想知道RDS MySQL和AnalyticDB MySQL之间用什么做数据同步好。但是数据同步的第一个DTS收费，主管不太想用，Flink我不太行，Kettle没用过，主管想用DataX，我就问了阿里后台的售后工程师，有的说可以，有的说不可以，后来看DataX的数据源这个图里面的ADS，阿里里面是把AnalyticDB MySQL叫做ADB的，所以我又纠结DataX到底能不能在他们之间导数据，最后我发现。好吧ADS就是AnalyticD

2022-03-30 17:47:30 2399

原创 windos配置jdk环境变量

配置环境变量详细步骤1.进入环境变量2.填写变量名：JAVA_HOME填写变量值：自己jkd在电脑中的绝对路径填写完记得确定3.双击进path（1）新建（2）添加这两个 %JAVA_HOME%\bin %JAVA_HOME%\jre\bin（3）确定3.填写变量名：CLASSPATH填写变量值：.;%JAVA_HOME%\lib;%JAVA_HOME%\lib\dt.jar;%JAVA_HOME%\lib\tools.jar4.最后记得全点确定。其他软件配置环境

2021-11-29 11:22:50 434

转载如何在hdfs中进行增删查，hadoop中常用命令

hadoop常见指令： hdfs dfs -copyFromLocal /local/data /hdfs/data：将本地文件上传到 hdfs上（原路径只能是一个文件） hdfs dfs -put /tmp/ /hdfs/ ：和 copyFromLocal 区别是，put 原路径可以是文件夹等 hadoop fs -ls / ：查看根目录文件 hadoop fs -ls /tmp/data：查看/tmp/data目录 hadoop fs -cat /tmp/a.tx

2021-11-17 00:15:31 372

原创 ubuntu中修改用户密码&修改mysql密码链接

复制了别人的虚拟机，里面有用户名不是自己的想修改步骤如下：1.进入到root用户下去对其他用户信息进行修改：su root2、gedit /etc/sudoers 修改所有原有用户名3、gedit /etc/passwd ,找到代表你的那一行，修改用户名为新的用户名。注意：只修改用户名！4、gedit /etc/shadow，找到代表你的那一行，修改用户名为新用户名。5、gedit /etc/group，你应该发现你的用户名在很多个组中，全部修改！6、 sudo mv /home/oldus

2021-11-14 17:48:15 1146

原创如何在xshell上进行复制粘贴

平时文档中代码太长，容易敲错的，复制粘贴会很好的让我们避免这些错误那具体步骤如下：1.点击工具，选择里面的按键对应复制：ctrl+shlft+c粘贴：ctrl+shlft+v按照上面的步骤来就可以了。...

2021-11-14 16:58:35 8344

原创 xshell连不上虚拟机的几种情况。还有ping不通网络的情况。

第一种情况：虚拟网络编辑器中第三位（209）和自己虚拟机中的第三位（209）保持一致，不显示自己ip的可以执行命令：sudo / sbin/dhclient再查看ip：ip a再不显示ip就往下看：1.先查看自己虚拟网络编辑器中的第三位是什么（我这上面的是209），先记住这个数字。2.修改虚拟机中的静态ip命令：sudo vi /etc/netplan/文件（注意这个文件名可能不一样，可以先到/etc/netplan目录下看一下有没有这个文件）文件中需要有这些内容，没有的补全。（注意这

2021-11-14 16:43:16 5490 1

原创大数据中的各个组件

数据产生是数据平台的源头，没有数据就没有大数据平台（数据产生传输处理）数据的产生：一.数据产生的来源分为以下几种：1.业务系统：来自企业IT系统存储在数据库的数据eg：POS销售系统、EPR系统、CRM系统2.Web系统：日志文件eg：访问了哪些网页、点击了哪些按钮、停留了多长时间3.手机App：传感器eg：指纹识别、人脸识别、位置、WIFI4.外部系统：爬虫数据或外部购买eg：舆情数据二.数据按照结构分为以下几种：1.结构化数据：格式非常规范，比较容易处理eg:数据库2.半结构

2021-11-11 17:57:16 4070

原创 Python如何下载网页上的视频

Python如何下载网页上的视频1.在电脑上创建一个文件夹2.在文件夹里输入cmd3.回车4.输入 pip install you-get 回车5.输入you-get 自己喜欢的视频链接回车6.下载成功

2021-09-11 21:34:50 6400 3

原创认识Python，python是什么？

认识Python，python是什么？Python是一门动态解释型弱类型编程语言。python的作者是Guido van Rossum（吉多·范罗苏姆）在1989年圣诞节期间，为了打发无聊的圣诞节而编写的一个编程语言。 Python1991年公开发行第一个版本，所以1991年被当做 Python的诞生年。现在最热门的三大编程语言：C python javapython连续两年进入TIOBE最佳年度语言排名前三名。Python现在已经成为大型编程语言Python已成为当今大学中最常

2021-09-11 12:52:52 313

原创 Xshell 更改系统时区详细步骤

Xshell 更改系统时区详细步骤root用户下su rootroot@master:~# tzselect 选择： 4）Asia==> 9)China ==> 1)Beijing Time ==> 1)Yes根据提示执行：TZ=‘Asia/Shanghai’ ; export TZ并将 TZ=‘Asia/Shanghai’ ; export TZ 命令添加到.profile中然后退出并重新登录现在再查看最终时区显示为CST，即中国标准时间。...

2021-09-11 12:32:42 772

原创 Hive面试基本须知

Hive面试基本Hive的优缺点:优点：1)操作接口采用类SQL语法，提供快速开发的能力（简单、容易上手）。2)避免了去写MapReduce，减少开发人员的学习成本。3)Hive的执行延迟比较高，因此Hive常用于数据分析，对实时性要求不高的场合。4)Hive优势在于处理大数据，对于处理小数据没有优势，因为Hive的执行延迟比较高。5)Hive支持用户自定义函数，用户可以根据自己的需求来实现自己的函数。缺点:1．Hive的HQL表达能力有限（1）迭代式算法无法表达（2）数据挖掘方面不擅

2021-08-06 14:27:03 163

原创 Scala集合——Map

Map集合不可变：val map01: Map[String, String] = Map(“libai” -> “1”, “litaibai” -> “2”, “litaitaibai” -> “3”)可变：import scala.collection.mutableval map03 = mutable.Map((“libai”, 1), (“litaibai”, 2), (“litaitaibai”, 2))object Demo08Map { def main(

2021-04-17 11:57:13 147

原创 Scala集合——Set

Set集合不可变val set =Set(1,2,3,4,1,2,3)（1）Set默认是不可变集合，数据无序（2）数据不可重复可变import scala.collection.mutableval set1= mutable.Set(1,2,3)object Demo07Set { def main(args: Array[String]): Unit = { //set不可变 val set =Set(1,2,3,4,1,2,3) println(set)

2021-04-17 11:36:55 147

原创 Scala集合——List

List集合分为可变和不可变（1）List默认为不可变集合val list = List(1, 2, 3, 4, 5)（2）可变ListBufferval buffer = ListBuffer(1, 2, 3)import scala.collection.mutableimport scala.collection.mutable.ListBufferobject Demo06List { def main(args: Array[String]): Unit = { /

2021-04-17 11:21:56 262

原创 Scala集合——数组

Scala集合——数组不可变数组：*1）第一种方式定义数组(定长数组)定义：val arr1 = new ArrayInt（1）new是关键字（2）[Int]是指定可以存放的数据类型，如果希望存放任意数据类型，则指定Any（3）(10)，表示数组的大小，确定后就不可以变化*2）第二种方式定义数组val arr1 = Array(1, 2)（1）在定义数组时，直接赋值（2）使用apply方法创建数组对象可变数组：（1）ArrayBuffer是有序的集合（2）增加元素使用的是appen

2021-04-17 09:56:56 305

原创 Scala面向对象-type

//type相当于给数据类型起别名object Demo04Type { def main(args: Array[String]): Unit = { val name:String="laowang" //自定义的数据类型相当于给string起别名 type s=String val name1:s="xiaowang" }}

2021-04-17 09:26:59 93

原创 Scala面向对象-App

//APP是一个特质，可以代替main作为程序的入口多用于测试object Demo03App extends App { println("hello word")}

2021-04-17 09:23:30 202

原创 Scala面向对象-枚举

Scala枚举——举例代码枚举类：需要继承Enumerationobject Demo02Enumeration extends Enumeration { val Hadoop=Value(1,"hadoop") val SPARK=Value(2,"spark") val FLINK=Value(3,"FLINK") val SCALA=Value(4,"SCALA") def main(args: Array[String]): Unit = { println

2021-04-17 09:18:51 89

xia3138641636的博客