- 博客(98)
- 收藏
- 关注
原创 《PySpark大数据分析实战》图书上线啦
Apache Spark是一个分布式处理引擎,用于在大规模数据集上执行数据工程、数据科学和机器学习任务。作为数据科学爱好者,您可能熟悉在本地机器上存储文件并使用Python对其进行处理,但是,本地机器有其局限性,无法处理大规模的数据集。要处理PB级的大规模数据集,仅了解Python框架是不够的。分布式处理是一种使用多台计算机来运行应用程序的方式,无需尝试在单台计算机上处理大型数据集,而是可以在相互通信的多台计算机之间分配任务。借助Spark,您可以实现单台计算机上不可能做到的事情,实现对PB级数据进行处理。
2023-12-09 17:51:25 1149 4
原创 第三期书生大模型实战营 第2关 Python 基础知识
Hello大家好,这里是第三期书生大模型实战营,闯关地图入门岛的第2关 Python 基础知识。我们将学会简单使用Python进行词频统计,并实现VSCode代码调试等。让我们开始吧~
2024-07-11 07:40:04 761
原创 第三期书生大模型实战营 第1关 Linux 基础知识
Hello大家好,这里是第三期书生大模型实战营,闯关地图入门岛的第1关 Linux 基础知识。我们将学会InternStudio开发机创建、配置远程连接、使用本地VSCode连接到开发机、创建脚本、创建虚拟环境、运行脚本等。让我们开始吧~
2024-07-10 06:40:51 1351
原创 书生·浦语大模型全链路开源体系-第7课
为了推动大模型在更多行业落地应用,让开发人员更高效地学习大模型的开发与应用,上海人工智能实验室重磅推出书生·浦语大模型实战营,为开发人员提供大模型学习和开发实践的平台。 本文是书生·浦语大模型全链路开源体系-第7课的课程实战。
2024-04-21 23:44:13 685
原创 书生·浦语大模型全链路开源体系-第6课
为了推动大模型在更多行业落地应用,让开发人员更高效地学习大模型的开发与应用,上海人工智能实验室重磅推出书生·浦语大模型实战营,为开发人员提供大模型学习和开发实践的平台。 本文是书生·浦语大模型全链路开源体系-第6课的课程实战。
2024-04-19 12:14:47 1109
原创 书生·浦语大模型全链路开源体系-第4课
为了推动大模型在更多行业落地应用,让开发人员更高效地学习大模型的开发与应用,上海人工智能实验室重磅推出书生·浦语大模型实战营,为开发人员提供大模型学习和开发实践的平台。 本文是书生·浦语大模型全链路开源体系-第4课的课程实战。
2024-04-17 18:26:49 1176
原创 书生·浦语大模型全链路开源体系-第5课
为了推动大模型在更多行业落地应用,让开发人员更高效地学习大模型的开发与应用,上海人工智能实验室重磅推出书生·浦语大模型实战营,为开发人员提供大模型学习和开发实践的平台。 本文是书生·浦语大模型全链路开源体系-第5课的课程实战。
2024-04-15 18:20:26 1423
原创 书生·浦语大模型全链路开源体系-第3课
为了推动大模型在更多行业落地应用,让开发人员更高效地学习大模型的开发与应用,上海人工智能实验室重磅推出书生·浦语大模型实战营,为开发人员提供大模型学习和开发实践的平台。 本文是书生·浦语大模型全链路开源体系-第3课的课程实战。
2024-04-12 18:13:45 1128
原创 书生·浦语大模型全链路开源体系-第2课
为了推动大模型在更多行业落地应用,让开发人员更高效地学习大模型的开发与应用,上海人工智能实验室重磅推出书生·浦语大模型实战营,为开发人员提供大模型学习和开发实践的平台。 本文是书生·浦语大模型全链路开源体系-第2课的课程实战。
2024-04-01 18:32:03 1463
原创 书生·浦语大模型全链路开源体系-第1课
为了推动大模型在更多行业落地应用,让开发人员更高效地学习大模型的开发与应用,上海人工智能实验室重磅推出书生·浦语大模型实战营,为开发人员提供大模型学习和开发实践的平台。
2024-03-28 18:26:04 788
原创 《PySpark大数据分析实战》-27.数据可视化图表Pyecharts介绍
大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第4节的内容:数据可视化图表Pyecharts介绍。
2024-01-10 13:44:17 1261 1
原创 《PySpark大数据分析实战》-26.数据可视化图表Seaborn介绍
大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第4节的内容:数据可视化图表Seaborn介绍。
2024-01-09 13:40:59 1335 2
原创 《PySpark大数据分析实战》-25.数据可视化图表Matplotlib介绍
大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第4节的内容:数据可视化图表Matplotlib介绍。
2024-01-05 13:36:20 1505 1
原创 《PySpark大数据分析实战》-24.数据可视化图表介绍
大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第3节的内容:数据可视化图表介绍。
2024-01-04 13:31:33 1190
原创 《PySpark大数据分析实战》-23.Pandas介绍DataFrame介绍
大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第2节的内容:Pandas介绍DataFrame介绍。
2024-01-03 13:44:19 879
原创 《PySpark大数据分析实战》-22.Pandas介绍Series介绍
大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第2节的内容:Pandas介绍Series介绍。
2024-01-02 13:44:07 877
原创 《PySpark大数据分析实战》-21.NumPy介绍数组的运算
大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第2节的内容:NumPy介绍数组的运算。
2023-12-27 13:46:12 897 2
原创 《PySpark大数据分析实战》-20.NumPy介绍数组的生成
大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第2节的内容:NumPy介绍数组的生成。
2023-12-26 13:16:47 840 2
原创 《PySpark大数据分析实战》-19.NumPy介绍ndarray介绍
大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第2节的内容:NumPy介绍ndarray介绍。
2023-12-25 22:50:46 911
原创 《PySpark大数据分析实战》-18.什么是数据分析
大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第1节的内容:什么是数据分析。
2023-12-23 16:25:52 1697 1
原创 《PySpark大数据分析实战》-17.云服务模式Databricks介绍运行作业
大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第5节的内容:云服务模式Databricks介绍运行作业。
2023-12-21 12:42:18 1031 2
原创 《PySpark大数据分析实战》-16.云服务模式Databricks介绍运行案例
大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第5节的内容:云服务模式Databricks介绍运行案例。
2023-12-20 23:03:07 1088
原创 《PySpark大数据分析实战》-15.云服务模式Databricks介绍创建集群
大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第5节的内容:云服务模式Databricks介绍创建集群。
2023-12-19 22:45:21 1264
原创 《PySpark大数据分析实战》-14.云服务模式Databricks介绍基本概念
大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第5节的内容:云服务模式Databricks介绍基本概念。
2023-12-18 23:02:58 1132 1
原创 《PySpark大数据分析实战》-13.Spark on YARN模式代码运行流程
大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第4节的内容:Spark on YARN模式代码运行流程。
2023-12-17 18:10:34 966
原创 《PySpark大数据分析实战》-12.Spark on YARN配置Spark运行在YARN上
大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第4节的内容:Spark on YARN配置Spark运行在YARN上。
2023-12-16 17:35:14 1498 1
原创 《PySpark大数据分析实战》-11.Spark on YARN模式安装Hadoop
大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第4节的内容:Spark on YARN模式安装Hadoop。
2023-12-16 16:57:24 1501
原创 《PySpark大数据分析实战》-10.独立集群模式的代码运行
大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第3节的内容:独立集群模式的代码运行。
2023-12-15 12:11:33 737
原创 《PySpark大数据分析实战》-09.Spark独立集群安装
大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第3节的内容:Spark独立集群安装。
2023-12-15 09:03:14 1294
原创 《PySpark大数据分析实战》-08.宽窄依赖和阶段划分
大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第2节的内容:宽窄依赖和阶段划分。
2023-12-14 13:19:47 912
原创 《PySpark大数据分析实战》-07.Spark本地模式安装
大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第2节的内容:Spark本地模式安装。
2023-12-14 13:17:29 1154
原创 《PySpark大数据分析实战》-06.安装环境准备
大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第1节的内容:安装环境准备。
2023-12-13 22:45:41 1205 4
原创 《PySpark大数据分析实战》-05.PySpark库介绍
大家好!今天为大家分享的是《PySpark大数据分析实战》第1章第5节的内容:PySpark库介绍。
2023-12-12 11:44:48 1094
原创 《PySpark大数据分析实战》-04.了解Spark
大家好!今天为大家分享的是《PySpark大数据分析实战》第1章第4节的内容:了解Spark。
2023-12-12 11:24:39 1274
原创 《PySpark大数据分析实战》-03.了解Hive
大家好!今天为大家分享的是《PySpark大数据分析实战》第1章第3节的内容:了解Hive。
2023-12-11 22:43:13 1046
原创 《PySpark大数据分析实战》-02.了解Hadoop
大家好!今天为大家分享的是《PySpark大数据分析实战》第1章第2节的内容:了解Hadoop。
2023-12-11 22:27:50 1260 2
原创 大数据FusionInsightHD-05.HBase从C50迁移到6.5.1(01)迁移概述
项目上最近全新部署了FusionInsight HD 6.5.1大数据集群,并且希望将老集群FusinInsight HD C50的所有业务都迁移到新集群上。由于在老集群C50上的HDFS、HBase中存在有大量的业务数据,因此将业务从C50迁移到6.5.1的过程中,就需要将C50上的业务数据同步迁移到新集群6.5.1上。
2023-09-07 14:43:29 1411 11
原创 大数据FusionInsightHD-07.HBase从C50迁移到6.5.1(03)6.5.1上准备Loader
在FusionInsight HD集群的HBase数据迁移过程中,需要通过Loader将老集群FusinInsight C50上获取HBase的数据加载到新集群FusionInsight 6.5.1,因此需要在新集群FusionInsight 6.5.1中添加Loader以及具有相应权限的用户loaderUser。本文主要介绍如何在新集群FusionInsight 6.5.1中创建loaderUser用户以及如何添加配置Loader。
2023-09-05 12:06:28 615 6
原创 大数据FusionInsightHD-06.HBase从C50迁移到6.5.1(02)C50上准备FTP Server
在FusionInsight HD集群的HBase数据迁移过程中,需要通过FTP-Server从老集群FusinInsight C50上获取HBase的数据,因此需要在老集群FusinInsight C50中添加FTP-Server以及具有相应权限的用户ftpUser。本文主要介绍如何在老集群FusinInsight C50中创建ftpUser用户以及如何添加配置FTP-Server。
2023-09-04 12:02:41 752 2
PicGo-Setup-2.3.1.exe
2023-01-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人