红陌樱花vip-CSDN博客

原创分布式存储快速入门HDFS

这是继我在CSDN发布的首篇精品万字原创“大数据平台环境搭建”之后的又一篇精品大作“分布式存储快速入门HDFS”，目前“大数据平台环境搭建”已被华为开发者联盟社区官方收录。相较于“大数据平台环境搭建”这篇处女作，本篇文章已经略显成熟，不管是从格式上，还是内容上都已经褪去了青涩。本篇文章重点在于讲解Hadoop HA+Federation以及使用Ambari进行HDFS的监控与维护。在实际的生产环境中，我们不可能仅仅只使用Hadoop的简单功能，所以本篇文章就讲解了如何去将集群进行“升级”并加以监控与维护。

2024-07-12 17:14:29 865

原创基于卷积神经网络模型的图像分类

本文研究了Kaggle上“Dogs vs. Cats”数据集的图像分类任务，比较了支持向量机（SVM）、随机森林（Random Forest）、k近邻（k-NN）和卷积神经网络（CNN）等多种算法的性能。实验结果表明，CNN在分类准确率上表现最佳，但传统的机器学习方法在某些情况下也具有一定的优势。研究还探讨了迁移学习在提升分类效果中的作用。本研究为图像分类算法的选择和优化提供了有价值的参考。

2024-07-12 16:28:25 751

原创 Python数据分析个人笔记7

这是我开始学习Python数据分析写的第7篇笔记，此系列文章共有7篇。本篇文章主要讲解openpyxl使用，涉及函数，以及数据可视化。

2024-06-08 01:27:20 1041

原创 Python数据分析个人笔记6

这是我开始学习Python数据分析写的第6篇笔记，此系列文章共有7篇。本篇文章主要讲解Function application。

2024-06-08 01:19:30 384

原创 Python数据分析个人笔记5

这是我开始学习Python数据分析写的第5篇笔记，此系列文章共有7篇。本篇文章主要讲解Series，Pandas Series 类似表格中的一个列（column），类似于一维数组，可以保存任何数据类型。

2024-06-07 01:03:26 571

原创 Python数据分析个人笔记4

这是我开始学习Python数据分析写的第4篇笔记，此系列文章共有7篇。本篇文章主要讲解数组连接和分割，数组添加和删除元素，连接数组，拆分数组，数组去重，数组排序，条件筛选以及读写文件。

2024-06-07 00:57:40 713

原创 Python数据分析个人笔记3

这是我开始学习Python数据分析写的第3篇笔记，此系列文章共有7篇。本篇文章主要讲解NumPy 中的矩阵以及统计函数。

2024-06-06 11:05:40 611

原创 Python数据分析个人笔记2

这是我开始学习Python数据分析写的第2篇笔记，此系列文章共有7篇。本篇文章主要讲解Numpy视图和副本，Numpy索引和切片，Numpy 广播(Broadcast)，Numpy迭代数组以及Numpy形状。

2024-06-06 11:01:36 609

原创 Python数据分析个人笔记1

这是我开始学习Python数据分析写的第1篇笔记，此系列文章共有7篇。本篇文章主要讲解安装miniconda，使用jupyter notebook，以及理解 NumPy。

2024-06-05 15:28:17 655 1

原创 05 Hadoop简单使用

主要讲到了hadoop2.x和hadoop3.x变化，HDFS常用命令，Java操作HDFS，MapReduce，压缩和yarn常用命令。

2024-06-05 14:41:12 1820 1

原创 04 Hive基础操作

这是系列的第四篇文章，接着前一篇03 Hadoop大数据。这篇主要就是针对hive来进行讲解，如何安装，配置，使用。这篇文章在本次系列中较长，可以根据目录跳转到自己需要的节点学习，最后面还有练习题。

2023-02-19 22:47:34 340

原创 03 Hadoop大数据

这是系列的第三篇文章，接着前一篇02 MySQL数据库管理系统。这篇主要就是讲解如何搭建Hadoop伪分布式以及hdfs的简单使用。我最早发布的第一篇文章“大数据平台环境搭建”中使用的是完全分布式，更为详细，这篇稍微简单一点。

2023-02-19 22:36:50 292

原创 02 MySQL数据库

这是系列的第二篇文章，接着前一篇01 Linux操作系统。这篇主要就是针对MySQL数据库管理系统进行讲解，涉及到在linux系统中安装mysql以及具体的使用。

2023-02-19 22:30:47 253

原创 01 Linux操作系统

本篇文章针对Linux操作系统进行了一个系统的讲解，并列出了常用操作命令以及注意事项等等。分别从简介、文件路径、基本指令、文件管理权限、编辑器、重定向、远程传输命令、压缩与解压和yum这九个板块依次介绍。这将是一个系列，从01开始，后面还有02、03、04等等。

2023-02-19 15:04:43 407

原创基于WebGIS的矿产资源信息管理系统的部署及运维

本篇文章是继我在CSDN发布的第一篇原创文章“大数据平台环境搭建”后第二篇涉及运维部署的教程文章。本篇文章主要分为两部分，上半部分截取我的论文“基于WebGIS的矿产资源信息管理系统的部署及运维”第四章的部分内容，下半部分补充内容是我后面添加的内容。本篇文章涉及到的技术都是“大数据平台环境搭建”里面没有的，分别是Nginx、docker、mysql、Redis、hive、sqoop...

2022-11-09 00:10:26 1455

原创 Jupyter Notebook安装代码提示功能

默认Jupyter Notebook没有安装代码提示功能，对很多萌新来说很不友好，但是我们可以可通过如下命令安装和配置使得Jupyter Notebook具备代码提供功能。

2022-06-21 09:37:09 6975 1

原创 Java Web 程序设计期末复习重要知识点总结

临近期末，对这学期学习的JavaWeb进行一个简单的复习总结，也希望能对萌新们有所帮助。本篇文章重点总结知识点，实操练习项目代码相关在我的“Java Web 程序设计”分类专栏其他文章。Java Web，是用Java技术来解决相关web互联网领域的技术栈。...

2022-06-20 00:39:11 5859

原创大数据平台环境搭建

这段时间基于大数据技术与应用大赛所做的大数据平台环境搭建，原创文章。在自己电脑上搭建过几遍，按照上述笔记搭建没有出现问题。家人们如果在尝试搭建的过程中出现问题可以在下方评论区留言或者私信，我看到后会回复。希望能对有需求的萌新有所帮助。...

2022-03-17 00:41:51 13839 6

spark-2.4.8-bin-without-hadoop.tgz

spark-2.4.8-bin-without-hadoop.tgz 是 Apache Spark 的一个二进制发行版本，其中不包含 Hadoop 的库。Spark 是一个用于大规模数据处理的快速、通用的大规模数据处理引擎。这个版本特别适用于那些想要使用 Spark 但已经在其环境中部署了 Hadoop 或不想与 Spark 捆绑的 Hadoop 版本一起使用 Hadoop 的用户。

2024-06-05

Typora.zip压缩包

Typora是一款功能强大且简洁易用的Markdown编辑器，由Abner Lee开发。Typora凭借其所见即所得的编辑方式、丰富的样式主题和编辑功能、高级的数学公式和图表支持以及跨平台兼容性等特点，成为了Markdown编辑器领域的佼佼者。无论是写作、笔记还是博客等场景，Typora都能为用户提供优雅而高效的Markdown编辑和预览体验。本压缩包解压即可用，无须激活，绿色安全。

2024-06-05

hbase-1.4.4-bin.tar.gz

hbase-1.4.4-bin.tar.gz 是 Apache HBase 1.4.4 版本的二进制发行包。Apache HBase 是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，它运行在 Hadoop Distributed FileSystem (HDFS) 上，提供了大数据的随机实时读写访问能力。 HBase 需要运行在 Hadoop 集群上，因此你需要先安装和配置 Hadoop。 HBase 1.4.4 通常与 Hadoop 2.x 版本兼容，但具体兼容性可能因 Hadoop 的子项目版本和特定配置而异。你可能还需要安装 Java Development Kit (JDK) 1.8 或更高版本，因为 HBase 是用 Java 编写的。

2024-06-05

mysql-5.6.10-linux-glibc2.5-x86-64.tar.gz

mysql-5.6.10-linux-glibc2.5-x86_64.tar.gz 是 MySQL 5.6.10 版本针对 Linux 系统（glibc 2.5 及以上版本，x86_64 架构）的二进制压缩包。在安装之前，应确保系统上没有与 MySQL 冲突的数据库系统（如 MariaDB），因为 MariaDB 是 MySQL 的一个分支，两者可能存在冲突。根据系统环境和需求，可能需要调整安装过程中的某些步骤和参数。该版本可能不是 MySQL 的最新版本，但由于其在发布后经过长时间的测试和优化，因此在许多场景下仍然是一个很好的选择。如果需要更高级的功能或更好的性能，可以考虑升级到更新的 MySQL 版本。

2024-06-05

大数据技术与应用大赛题库

赛项以大数据技术与应用为核心内容和工作基础，重点考查参赛选手基于Spark、Flink平台环境下，充分利用Spark Core、Spark SQL、Flume、Kafka、Flink等技术的特点，综合软件开发相关技术，解决实际问题的能力，具体包括：掌握基于Spark的离线分析平台、基于Flink的实时分析平台，按照项目需求安装相关技术组件并按照需求进行合理配置；掌握基于Spark的离线数据抽取相关技术，完成指定数据的抽取并写入Hive分区表中；综合利用Spark Core、Spark SQL等技术，使用Scala开发语言，完成某电商系统数据的离线统计服务，包括销量前5商品统计、某月的总销售额统计、每个月的销售额统计、每个用户在线总时长统计，并将统计结果存入MySQL数据库中；综合利用Flume、Flink相关技术，使用Scala开发语言，完成将某电商系统的用户操作日志抽取到Kafka中，消费Kafka中的数据并计算商城在线人数,并统计该电商系统的UV与PV；

2024-06-05

eclipse中文包BabelLanguagePack-eclipse-zh_4.22.0.zip

可将eclipse设置成中文模式，设置后重启即可生效，具体如何设置查看我的“Java Web 程序设计期末复习总结”文章。基于原本意思，无法做到百分百翻译，一些特有名词无法翻译，但对萌新来说已经足够了。

2022-06-17

hive驱动压缩包.zip

在虚拟机Linux系统上面安装部署hive后，如果需要在Windows系统上的IntelliJ IDEA 2020.3.3中连接使用Linux系统上的hive需要用到的驱动程序。包含：hive-exec-2.3.9.jar 、hive-jdbc-2.3.9.jar、hive-service-2.3.9.jar

2022-06-16

apache-tomcat-9.0.41.zip

Apache是web服务器，Tomcat是应用服务器，apache tomcat只是一个servlet容器，是Apache的扩展；Apache和Tomcat都可以做为独立的web服务器来运行，但是Apache不能解释java程序。我后面Javaweb程序设计文章里面在eclipse上会用到apache-tomcat-9.0.41这个服务器。两者都是一种容器，只不过发布的东西不同：Apache是html容器，功能像IIS一样；Tomcat是jsp/servlet容器，用于发布jsp及java的，类似的有IBM的websphere、BEA的Weblogic，sun的JRun等等。打个比方：Apache是一辆卡车，上面可以装一些东西如html等。但是不能装水，要装水必须要有容器（桶），Tomcat就是一个桶（装像Java这样的水），而这个桶也可以不放在卡车上。 Apache是世界使用排名第一的Web服务器。它可以运行在几乎所有广泛使用的计算机平台上。

2022-06-16

怎样将电脑中360安全卫士相关的卸干净？

2022-05-26

Tableau安装不了，如何解决？

2022-03-16

TA创建的收藏夹 TA关注的收藏夹

TA关注的人