- 博客(98)
- 收藏
- 关注
![](https://csdnimg.cn/release/blogv2/dist/pc/img/listFixedTop.png)
原创 《PySpark大数据分析实战》图书上线啦
Apache Spark是一个分布式处理引擎,用于在大规模数据集上执行数据工程、数据科学和机器学习任务。作为数据科学爱好者,您可能熟悉在本地机器上存储文件并使用Python对其进行处理,但是,本地机器有其局限性,无法处理大规模的数据集。要处理PB级的大规模数据集,仅了解Python框架是不够的。分布式处理是一种使用多台计算机来运行应用程序的方式,无需尝试在单台计算机上处理大型数据集,而是可以在相互通信的多台计算机之间分配任务。借助Spark,您可以实现单台计算机上不可能做到的事情,实现对PB级数据进行处理。
2023-12-09 17:51:25
1122
4
原创 第三期书生大模型实战营 第2关 Python 基础知识
Hello大家好,这里是第三期书生大模型实战营,闯关地图入门岛的第2关 Python 基础知识。我们将学会简单使用Python进行词频统计,并实现VSCode代码调试等。让我们开始吧~
2024-07-11 07:40:04
640
原创 第三期书生大模型实战营 第1关 Linux 基础知识
Hello大家好,这里是第三期书生大模型实战营,闯关地图入门岛的第1关 Linux 基础知识。我们将学会InternStudio开发机创建、配置远程连接、使用本地VSCode连接到开发机、创建脚本、创建虚拟环境、运行脚本等。让我们开始吧~
2024-07-10 06:40:51
1139
原创 书生·浦语大模型全链路开源体系-第7课
为了推动大模型在更多行业落地应用,让开发人员更高效地学习大模型的开发与应用,上海人工智能实验室重磅推出书生·浦语大模型实战营,为开发人员提供大模型学习和开发实践的平台。 本文是书生·浦语大模型全链路开源体系-第7课的课程实战。
2024-04-21 23:44:13
600
原创 书生·浦语大模型全链路开源体系-第6课
为了推动大模型在更多行业落地应用,让开发人员更高效地学习大模型的开发与应用,上海人工智能实验室重磅推出书生·浦语大模型实战营,为开发人员提供大模型学习和开发实践的平台。 本文是书生·浦语大模型全链路开源体系-第6课的课程实战。
2024-04-19 12:14:47
1031
原创 书生·浦语大模型全链路开源体系-第4课
为了推动大模型在更多行业落地应用,让开发人员更高效地学习大模型的开发与应用,上海人工智能实验室重磅推出书生·浦语大模型实战营,为开发人员提供大模型学习和开发实践的平台。 本文是书生·浦语大模型全链路开源体系-第4课的课程实战。
2024-04-17 18:26:49
1095
原创 书生·浦语大模型全链路开源体系-第5课
为了推动大模型在更多行业落地应用,让开发人员更高效地学习大模型的开发与应用,上海人工智能实验室重磅推出书生·浦语大模型实战营,为开发人员提供大模型学习和开发实践的平台。 本文是书生·浦语大模型全链路开源体系-第5课的课程实战。
2024-04-15 18:20:26
1335
原创 书生·浦语大模型全链路开源体系-第3课
为了推动大模型在更多行业落地应用,让开发人员更高效地学习大模型的开发与应用,上海人工智能实验室重磅推出书生·浦语大模型实战营,为开发人员提供大模型学习和开发实践的平台。 本文是书生·浦语大模型全链路开源体系-第3课的课程实战。
2024-04-12 18:13:45
1099
原创 书生·浦语大模型全链路开源体系-第2课
为了推动大模型在更多行业落地应用,让开发人员更高效地学习大模型的开发与应用,上海人工智能实验室重磅推出书生·浦语大模型实战营,为开发人员提供大模型学习和开发实践的平台。 本文是书生·浦语大模型全链路开源体系-第2课的课程实战。
2024-04-01 18:32:03
1397
原创 书生·浦语大模型全链路开源体系-第1课
为了推动大模型在更多行业落地应用,让开发人员更高效地学习大模型的开发与应用,上海人工智能实验室重磅推出书生·浦语大模型实战营,为开发人员提供大模型学习和开发实践的平台。
2024-03-28 18:26:04
729
原创 《PySpark大数据分析实战》-27.数据可视化图表Pyecharts介绍
大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第4节的内容:数据可视化图表Pyecharts介绍。
2024-01-10 13:44:17
1226
1
原创 《PySpark大数据分析实战》-26.数据可视化图表Seaborn介绍
大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第4节的内容:数据可视化图表Seaborn介绍。
2024-01-09 13:40:59
1295
2
原创 《PySpark大数据分析实战》-25.数据可视化图表Matplotlib介绍
大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第4节的内容:数据可视化图表Matplotlib介绍。
2024-01-05 13:36:20
1446
1
原创 《PySpark大数据分析实战》-24.数据可视化图表介绍
大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第3节的内容:数据可视化图表介绍。
2024-01-04 13:31:33
1148
原创 《PySpark大数据分析实战》-23.Pandas介绍DataFrame介绍
大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第2节的内容:Pandas介绍DataFrame介绍。
2024-01-03 13:44:19
851
原创 《PySpark大数据分析实战》-22.Pandas介绍Series介绍
大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第2节的内容:Pandas介绍Series介绍。
2024-01-02 13:44:07
849
原创 《PySpark大数据分析实战》-21.NumPy介绍数组的运算
大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第2节的内容:NumPy介绍数组的运算。
2023-12-27 13:46:12
854
2
原创 《PySpark大数据分析实战》-20.NumPy介绍数组的生成
大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第2节的内容:NumPy介绍数组的生成。
2023-12-26 13:16:47
806
2
原创 《PySpark大数据分析实战》-19.NumPy介绍ndarray介绍
大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第2节的内容:NumPy介绍ndarray介绍。
2023-12-25 22:50:46
882
原创 《PySpark大数据分析实战》-18.什么是数据分析
大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第1节的内容:什么是数据分析。
2023-12-23 16:25:52
1676
1
原创 《PySpark大数据分析实战》-17.云服务模式Databricks介绍运行作业
大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第5节的内容:云服务模式Databricks介绍运行作业。
2023-12-21 12:42:18
1002
2
原创 《PySpark大数据分析实战》-16.云服务模式Databricks介绍运行案例
大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第5节的内容:云服务模式Databricks介绍运行案例。
2023-12-20 23:03:07
1052
原创 《PySpark大数据分析实战》-15.云服务模式Databricks介绍创建集群
大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第5节的内容:云服务模式Databricks介绍创建集群。
2023-12-19 22:45:21
1238
原创 《PySpark大数据分析实战》-14.云服务模式Databricks介绍基本概念
大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第5节的内容:云服务模式Databricks介绍基本概念。
2023-12-18 23:02:58
1086
1
原创 《PySpark大数据分析实战》-13.Spark on YARN模式代码运行流程
大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第4节的内容:Spark on YARN模式代码运行流程。
2023-12-17 18:10:34
924
原创 《PySpark大数据分析实战》-12.Spark on YARN配置Spark运行在YARN上
大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第4节的内容:Spark on YARN配置Spark运行在YARN上。
2023-12-16 17:35:14
1440
1
原创 《PySpark大数据分析实战》-11.Spark on YARN模式安装Hadoop
大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第4节的内容:Spark on YARN模式安装Hadoop。
2023-12-16 16:57:24
1481
原创 《PySpark大数据分析实战》-10.独立集群模式的代码运行
大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第3节的内容:独立集群模式的代码运行。
2023-12-15 12:11:33
711
原创 《PySpark大数据分析实战》-09.Spark独立集群安装
大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第3节的内容:Spark独立集群安装。
2023-12-15 09:03:14
1272
原创 《PySpark大数据分析实战》-08.宽窄依赖和阶段划分
大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第2节的内容:宽窄依赖和阶段划分。
2023-12-14 13:19:47
882
原创 《PySpark大数据分析实战》-07.Spark本地模式安装
大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第2节的内容:Spark本地模式安装。
2023-12-14 13:17:29
1124
原创 《PySpark大数据分析实战》-06.安装环境准备
大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第1节的内容:安装环境准备。
2023-12-13 22:45:41
1148
4
原创 《PySpark大数据分析实战》-05.PySpark库介绍
大家好!今天为大家分享的是《PySpark大数据分析实战》第1章第5节的内容:PySpark库介绍。
2023-12-12 11:44:48
1058
原创 《PySpark大数据分析实战》-04.了解Spark
大家好!今天为大家分享的是《PySpark大数据分析实战》第1章第4节的内容:了解Spark。
2023-12-12 11:24:39
1212
原创 《PySpark大数据分析实战》-03.了解Hive
大家好!今天为大家分享的是《PySpark大数据分析实战》第1章第3节的内容:了解Hive。
2023-12-11 22:43:13
1025
原创 《PySpark大数据分析实战》-02.了解Hadoop
大家好!今天为大家分享的是《PySpark大数据分析实战》第1章第2节的内容:了解Hadoop。
2023-12-11 22:27:50
1218
2
原创 大数据FusionInsightHD-05.HBase从C50迁移到6.5.1(01)迁移概述
项目上最近全新部署了FusionInsight HD 6.5.1大数据集群,并且希望将老集群FusinInsight HD C50的所有业务都迁移到新集群上。由于在老集群C50上的HDFS、HBase中存在有大量的业务数据,因此将业务从C50迁移到6.5.1的过程中,就需要将C50上的业务数据同步迁移到新集群6.5.1上。
2023-09-07 14:43:29
1102
11
原创 大数据FusionInsightHD-07.HBase从C50迁移到6.5.1(03)6.5.1上准备Loader
在FusionInsight HD集群的HBase数据迁移过程中,需要通过Loader将老集群FusinInsight C50上获取HBase的数据加载到新集群FusionInsight 6.5.1,因此需要在新集群FusionInsight 6.5.1中添加Loader以及具有相应权限的用户loaderUser。本文主要介绍如何在新集群FusionInsight 6.5.1中创建loaderUser用户以及如何添加配置Loader。
2023-09-05 12:06:28
539
6
原创 大数据FusionInsightHD-06.HBase从C50迁移到6.5.1(02)C50上准备FTP Server
在FusionInsight HD集群的HBase数据迁移过程中,需要通过FTP-Server从老集群FusinInsight C50上获取HBase的数据,因此需要在老集群FusinInsight C50中添加FTP-Server以及具有相应权限的用户ftpUser。本文主要介绍如何在老集群FusinInsight C50中创建ftpUser用户以及如何添加配置FTP-Server。
2023-09-04 12:02:41
677
2
PicGo-Setup-2.3.1.exe
2023-01-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人