自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(74)
  • 收藏
  • 关注

原创 【2024-05-31】JS逆向之易企秀_扒易企秀页面内容

我滴个姥姥,好像是好久没跟了呀,主要是实在不知道写啥了今天这个表单是最近碰到,就拿出来分享下吧。

2024-06-20 02:05:41 447

原创 Pandas - 数据分组统计_pandas分组计数(1)

示例3:求各二级分类的七天点击量。首先按“二级分类”分类,而后进行分组统计求和。

2024-06-20 00:59:27 264

原创 git笔记之撤销、回退、reset方面的笔记

如果你已经做了一个commit,但还没有将其push到远程仓库,并且希望修改这次commit的信息,你可以使用命令进行操作。打开你的命令行工具。使用git log查看最近的commit,确保你要修改的是最近一次的commit信息。输入以下命令来修改最后一次的commit信息:这将打开你的默认文本编辑器,允许你修改commit信息。在编辑器中修改commit信息,然后保存并关闭编辑器。如果你想直接在命令行中修改commit信息,而不是打开文本编辑器,可以使用以下命令(其中。

2024-06-19 23:49:28 942

原创 最新tried to access method com(2),2024年最新阿里面试100%会问到的大数据开发

做了几个测试,其他版本不变,hadoop.version 为 2.4.0,2.4.1,2.5.2,2.6.1,2.6.4 都会报上面的错误,不知道是不是hadoop的bug,有人说将hadoop的源码重新编译一下就行,但我没试。把hadoop version改成2.2.0就可以了,测了一下2.7.2也可以,所以估计是hadoop的一个坑,2.7.2就修复了。、实战项目、大纲路线、讲解视频,并且后续会持续更新**

2024-05-16 06:48:41 586

原创 最新TDengine:开源、高效的物联网大数据平台(1),2024必看-大数据开发高级面试题总结

TDengine是涛思数据专为物联网、车联网、工业互联网、IT运维等设计和优化的大数据平台,广泛运用于物联网、车联网、工业互联网、IT运维等领域。它和上述的平台主要区别是,分成社区版、企业版和云服务版,其中社区版免费开源面向广大用户。既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新。

2024-05-16 06:48:08 630

原创 最新sql大数据基础题错误积累,看完直呼内行

以下删除表数据语句正确的是?(A)

2024-05-16 06:47:35 293

原创 最新SQL后计算的利器_有序计算和分步计算 sql,2024年最新大数据中网络图片加载和缓存源码分析

Kotlin基于JVM,且在链式编程和Lambda语法上对Stream进行了一系列改进,也可以用于SQL后计算。但因为编译型语言的底层,Kotlin只能对Stream小幅微调,重大缺点一个没少。Python Pandas有较强大的结构化数据处理能力,有时也可以用于SQL后计算,但因为缺乏易用的接口,很难被Java集成,很少出现在正式项目中。esProc SPL是更好的SQL后计算技术。

2024-05-16 06:47:02 592

原创 大数据进阶(二):数据可视化和分析工具推荐_免费大数据分析软件(1)

还能够方便合作者在同一个服务器上分享备份,email和上传数据,快速同步不同版本数据,Fusion Tables可以上传100MB的表格文件,同时支持CSV和XLS格式,当然也可以把Google Docs里的表格导入进来使用。这个东西的主要功能是帮用户整理数据,接下来的演示视频效果非常好:用户下载了一个 CSV 文件,但是同一个栏中的同一个属性有多种写法:全称,缩写,后面加了空格的,单数复数格式不一的。这些工具提供了不同的可视化选项,针对不同的应用场景。有时,你需要你的数据的图形化的表达。

2024-05-15 22:00:47 657

原创 大数据进阶(一):4个最受欢迎的大数据可视化工具(抛砖引玉篇(1)

想像阅读书本一样阅读数据流?这只有在电影中才有可能发生。在现实世界中,企业必须使用数据可视化工具来读取原始数据的趋势和模式。大数据可视化是进行各种大数据分析解决的最重要组成部分之一。一旦原始数据流被以图像形式表示时,以此做决策就变得容易多了。尽管实际上存在着无数专门用于大数据可视化的工具,且它们都是既开源又专有的,在这其中还是有一些工具表现比较突出,因为它们提供了上述所有或者很多部分功能。我们将介绍4种最受欢迎的大数据可视化工具,帮助大家选择适合自己需求的工具。

2024-05-15 22:00:13 515

原创 大数据进阶之路——Spark SQL 之 DataFrame&&Dataset_dataframe &&

(img-D5OdfT9t-1715781559596)](img-Hl4eohXL-1715781559596)]* DataFrame中的操作操作。

2024-05-15 21:59:41 1694

原创 大数据趣味学习探讨(二):我是怎么坚持学习的_怎么进入北京大数据研究院

2.1、调研日前,北京大数据研究院联合大数据分析与应用技术国家工程实验室、北京治数科技有限公司共同发布了《2022年中国大数据产业发展指数报告》。研究团队在2020年、2021年连续发布大数据产业发展指数的基础上,深入调研了各地大数据政策环境、大数据产业和企业发展状况,基于自身企业库中收录的 7472 家大数据企业数据和相关合作方数据,对全国 31 个省级行政区(不包含港澳台地区)和 150个 重点城市的大数据产业发展情况进行综合评估。

2024-05-15 21:59:08 700

原创 大数据必学Java知识(一):Java基础入门语法和安装_大数据入门 helloword(2)

数据类型 变量名 = 数据值;数据类型:为空间中存储的数据加入类型限制。整数?小数?变量名:自己要为空间起的名字,没有难度数据值: 空间中要存储的数值,没有难度。

2024-05-15 11:17:08 279

原创 大数据必学Java知识(一):Java基础入门语法和安装_大数据入门 helloword(1)

数据类型 变量名 = 数据值;数据类型:为空间中存储的数据加入类型限制。整数?小数?变量名:自己要为空间起的名字,没有难度数据值: 空间中要存储的数值,没有难度。

2024-05-15 11:16:32 245

原创 大数据开发(牛客)面试被问频率最高的几道面试题_数据开发(牛客)面试被问频率最高的几道面试题

如果Rowkey是按时间戳的方式递增,不要将时间放在二进制码的前面,建议将Rowkey的高位作为散列字段,由程序循环生成,低位放时间字段,将会提高数据均衡分布在每个Regionserver实现负载均衡的几率。比如我们在平时的开发中,需要对数据进行count,sum,max等操作,这些中间的结果(即是状态)是需要保存的,因为要不断的更新,这些值或者变量就可以理解为是一种状态,拿读取kafka为例,我们需要记录数据读取的位置(即是偏移量),并保存offest,这时offest也可以理解为是一种状态。

2024-05-15 11:15:55 319

原创 大数据开发(牛客)面试被问频率最高的几道面试题_数据开发(牛客)面试被问频率最高的几道面试题(1)

美团×15,阿里×3,字节×6,头条,滴滴,百度,腾讯×4,Shopee,小米,爱奇艺,祖龙娱乐,360×5,商汤科技,网易×5,51×2,星环科技,招银网络,映客直播,字节×2,有赞,58×3,华为x2,创略科技,米哈游,快手,京东×3,趋势科技,海康威视,顺丰,好未来,一点资讯,冠群驰骋,中信信用卡中心,金山云,米哈游,途牛。将数据倾斜提前到上游的Hive ETL,每天仅执行一次,只有那一次是比较慢的,而之后每次Java调用Spark作业时,执行速度都会很快,能够提供更好的用户体验。

2024-05-15 11:15:18 255

原创 【大数据面试题】(六)Flume 相关面试题总结_flume 和 kafka 采集日志的区别,采集日志时中断了,如何记录之前的日志(1)

使用官方提供的 flumeKafka 插件,插件的实现方式是自定义了 flume 的 sink,将数据从channle 中取出,通过 kafka 的producer 写入到 kafka 中,可以自定义分区等。Flume channel 使用被动存储机制. 它存储的数据的写入是靠 Flume source 来完成的, 数据的读取是靠后面的组件 Flume sink 来完成的.Flume 采集中间停了,可以采用文件的方式记录之前的日志,而 kafka 是采用 offset 的方式记录之前的日志。

2024-05-15 02:38:28 1034

原创 【大数据计算】(二) HBase 的安装和基础编程_singlecolumvaluefilter介绍

如位于:/usr/local/hbase/lib目录下,单击界面中的Libraries选项卡,再单击界面右侧的Add External JARs按钮,选中/usr/local/hbase/lib目录下的所有JAR包,点击OK,继续添加JAR包,选中client-facing-thirdparty下的所有JAR文件,点击OK。利用4中的程序,创建上表:表scores的概念视图如上图所示。创建并插入相关数据后,查看Hbase java api 文档。用于删除一个单元格数据,是 put 的反向操作;

2024-05-15 02:37:53 1001

原创 【大数据安全】大数据安全的挑战与对策&基础设施安全_数据安全面临的挑战图解

利用大数据分析做安全态势感知,实现威胁的检测、响应和防御,包括智能监测、威胁预测、智能响应和可视化分析等技术方向。通过运营管理策略,实现安全合规、风险管控和安全合作等。

2024-05-15 02:37:17 578

原创 【大数据安全-Kerberos】Kerberos常见问题及解决方案_gss initiate failed

请参阅配置Kerberos客户端配置krb5.conf以使用TCP和/或调查网络问题。请参阅在与KDC通信时强制Kerberos客户端使用TCPa-d:确保服务的主机名,URL,通信的NIC和keytab匹配。从Cloudera Manager中,导航到 管理>安全性 ,然后单击 导入Kerberos帐户管理器凭据以将管理凭据重新导入到Cloudera Manager中。确保主机名解析为与KDC和其他服务通信的服务的IP。查看:错误:访问Oozie WebUI时出现“ HTTP状态401”

2024-05-15 02:36:41 1049

原创 java编程开发多线程锁的8个问题分析_方法锁对别的线程有影响吗(4)

【代码】java编程开发多线程锁的8个问题分析_方法锁对别的线程有影响吗(4)

2024-05-14 17:16:44 278

原创 java编程开发多线程锁的8个问题分析_方法锁对别的线程有影响吗(3)

(3) 普通的hello方法,是先打短信还是hello。(5) 两个静态同步方法,1部手机,先打印短信还是邮件。(2) 停4秒在短信方法内,先打印短信还是邮件。(4) 现在有两部手机,先打印短信还是邮件。(1) 标准访问,先打印短信还是邮件。

2024-05-14 17:16:08 303

原创 java编程开发多线程锁的8个问题分析_方法锁对别的线程有影响吗(2)

【代码】java编程开发多线程锁的8个问题分析_方法锁对别的线程有影响吗(2)

2024-05-14 17:15:32 384

原创 java编程开发多线程锁的8个问题分析_方法锁对别的线程有影响吗(1)

7 1个静态同步方法,1个普通同步方法,1部手机,先打印短信还是邮件。8 1个静态同步方法,1个普通同步方法,2部手机,先打印短信还是邮件。6 两个静态同步方法,2部手机,先打印短信还是邮件。

2024-05-14 17:14:54 286

原创 2024年最新C++实现的二叉树创建和遍历,超入门邻家小女也懂了_c+(2),大数据开发开发两年

树(Tree)是n(n≥0)个节点的有限集。空结点一般用null描述,如:{1,2,3,4,5,6,7,8,null,10,11,null,13,null,15}。遍历结果: 1 [2 [4 8 9] [5 10 11]] [3 [6 12 13] [7 14 15] “遍历结果: [[8 4 9] 2 [10 5 11]] 1 [[12 6 13] 3 [14 7 15]] “遍历结果: [[8 9 4] [10 11 5] 2] [[12 13 6] [14 15 7] 3] 1 “

2024-05-14 08:38:07 336

原创 2024年最新C++入门学习(一) Hello(1),大专生出身

就这玩意:(这水印)跟你们用的可能不一样。(反正都差不多,能用就行)第一步没了。😃。

2024-05-14 08:37:31 259

原创 2024年最新c++介绍与入门基础(详细总结),2024年最新大数据开发工程师面试该怎么准备

定义命名空间,需要使用到namespace关键字,后面跟命名空间的名字,然后接一对{}即可,{}中即为命名空间的成员。命名空间的名字,一般开发中是用项目名字做命名空间名。1.正常的命名空间定义// 命名空间中可以定义变量/函数/类型int val;2.命名空间可以嵌套int val;int a;int b;3.同一个工程中允许存在多个相同名称的命名空间,编译器最后会合成同一个命名空间中。通过预处理后,文件test.h与test.c都将展开。

2024-05-14 08:36:55 1007

原创 2024年最新C · 初阶 分支语句(选择结构)(3),2024年最新2024最新华为大数据开发校招面试题

C语言0非0这里的一对{ }就是一个代码块。

2024-05-14 08:36:18 253

原创 2024年大数据最新【Hadoop】Hadoop 编译源码(3),2024年最新大数据开发应用开发基础大纲

【代码】2024年大数据最新【Hadoop】Hadoop 编译源码(3),2024年最新大数据开发应用开发基础大纲。

2024-05-13 23:49:55 361

原创 2024年大数据最新【Git企业开发】第四节(3),2024年最新阿里P7亲自教你

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新需要这份系统化资料的朋友,可以戳这里获取网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。需要这份系统化资料的朋友,可以戳这里获取一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业

2024-05-13 23:49:19 837

原创 2024年大数据最新【Flume】(四)Flume 企业真实面试经验_flume 大厂(1),2024年最新大数据开发开发岗还不会这些问题

组件是专门用来收集数据的,可以处理各种类型、各种格式的日志数据,包括 avro、thrift、exec、jms、spooling directory、netcat、sequence generator、syslog、http、legacy。type 选择 memory 时 Channel 的性能最好,但是如果 Flume 进程意外挂掉可能会丢失数据。组件是用于把数据发送到目的地的组件,目的地包括 HDFS、Logger、avro、thrift、ipc、file、Hbase、solr、自定义。

2024-05-13 23:48:43 824

原创 2024年大数据最新【Flink】(八)容错机制_6(2),2024最新大厂高频微服务面试总结

然后,你安排一个助手,让他在你和朋友拨到皮筋时记录总数。相反,你向其他人发出错误警示,然后你们都从上一根皮筋处开始重数,助手则会告诉每个人重数时的起始数值,例如在粉色皮筋处的数值是多少。总状态(珠子的总数)在每颗珠子被拨动之后更新一次,助手则会保存与每根皮筋对应的检查点状态,如当遇到粉色皮筋时一共数了多少珠子,当遇到橙色皮筋时又是多少。如果项链上有很多珠子,你显然不想从头再数一遍,尤其是当三人的速度不一样却又试图合作的时候,更是如此(比如想记录前一分钟三人一共数了多少颗珠子,回想一下一分钟滚动窗口)。

2024-05-13 23:48:06 735

原创 第十四届蓝桥杯集训——if——配套基础示例_java我家的狗7岁了,7岁的狗相当于多大年龄的人呢 已知 狗的前二年(2)

解:根据:三角形三边关系是三角形三条边关系的定则,具体内容是在一个三角形中,任意两边之和大于第三边,任意两边之差小于第三边。输入3 4 5,输入true。

2024-05-12 20:53:05 411

原创 第十四届蓝桥杯集训——if——配套基础示例_java我家的狗7岁了,7岁的狗相当于多大年龄的人呢 已知 狗的前二年(1)

输入3 4 5,输入true。

2024-05-12 20:52:29 346

原创 第十四届蓝桥杯校模拟赛-编程大题详解+代码(二)_第十四届蓝桥杯广州新华学院校赛题目

接下来 n 行,每行包含一个时刻 T 和两个非负整数 U, I,表示在时刻 T 充电电压变为 U(单位伏),电流变为 I(单位A)。输入一个由小写英文字母组成的字符串,请将其中的元音字母(a, e, i, o, u)转换成大写,其它字母仍然保持小写。如果周一做核酸,周二显示核酸天数为 1 天,周三显示 2 天,以此类推,周六显示 5 天,周日显示 6 天。输出一个整数,表示总共通电的电能为多少焦耳,其中 1 焦耳等于 1 伏乘以1 安乘以 1 秒。输入第一行包含一个整数 n , 表示记录的条数。

2024-05-12 20:51:53 907

原创 第六篇【传奇开心果系列】Python的自动化办公库技术点案例示例:大学生数据全方位分析挖掘经典案例

sns.lineplot(data=monthly_attendance, x=‘月份’, y=‘迟到次数’, hue=‘年份’, marker=‘o’, palette=‘Set1’)sns.lineplot(data=monthly_attendance, x=‘月份’, y=‘早退次数’, hue=‘年份’, marker=‘o’, palette=‘Set2’)sns.scatterplot(x=‘体重’, y=‘身高’, data=df, hue=‘性别’, style=‘运动习惯’)

2024-05-12 20:51:17 888

原创 学习python,我使用代码悄悄集齐了五福~哎嘿嘿_python实现过年集五福活动(1)

今天呢,写一个啥呀············我也不晓得,啊哈哈哈哈哈今天写一个%90会出敬业福哦,啊哈哈哈哈。

2024-05-12 03:43:16 421

原创 学C C++想提升功底 可以花点时间看看这篇博客---C语言程序环境和预处理

define 机制包括了一个规定,允许把参数替换到文本中,这种实现通常称为宏(macro)或定义宏(define macro)也可以看做宏函数。下面是使用格式:其中的 parament-list 是一个由逗号隔开的符号表,它们可能出现在stuff中。注意:参数列表的左括号必须与name紧邻。如果两者之间有任何空白存在,参数列表就会被解释为stuff的一部分。下面看使用示例:上面代码通过#define宏定义了 ADD(a,b) a+b。

2024-05-12 03:42:40 696

原创 字节面试问到CPU的多级缓存架构,诸佬们怎么回答?_面试 cpu的缓存机制

与L1,L2缓存一样,首先会将L3缓存锁住,将L3缓存复制到L2缓存,在从L2缓存复制到L1缓存上,然后CPU从L1缓存中读取数据后,会对L3进行解锁操作,此时表示从L3缓存中读取数据操作结束。如果CPU需要读取L2缓存中的数据,那么会先从L1缓存中读取数据,如果要读取的数据在L1缓存中不存在,就会将L2缓存加锁,加锁成功后,将L2缓存中的数据复制到L1缓存上,CPU从L1缓存中读取数据完成后,再对L2缓存进行解锁操作,意味着从L2缓存中读取数据的操作结束。L1缓存的存储速度最快,但是存储容量最小。

2024-05-12 03:42:04 843

原创 如何高效接入 Flink: Connecter Catalog API 核心设计与社区进展_flink catelog api

Source API 已经引入很多版本,从 1.12 开始我们有了 Source API 的第一个版本,到 Flink 1.14 开始逐渐达到一个稳定的状态,并标记成 Public。如果了解 Flink 的时间较长,我们之前还有 InputFormat 和 SourceFunction。请大家注意这些 API 在 2.0 都会被弃用掉,如果需要开发一个新的 Connector ,请关注最新的 Source API。

2024-05-12 03:41:27 697

原创 大数据最全【Redis高手修炼之路】①Redis是什么_萨尔瓦多·桑菲利波普(1),2024年最新腾讯T3大佬亲自讲解

Redis(Remote Dictionary Server ),即远程字典服务,是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。它通常被称为数据结构服务器,因为值(value)可以是 字符串(String), 哈希(Map), 列表(list), 集合(sets) 和 有序集合(sorted sets)等类型。但一群人才能走的更远!

2024-05-11 19:04:44 563

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除