自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(98)
  • 收藏
  • 关注

原创 《PySpark大数据分析实战》图书上线啦

Apache Spark是一个分布式处理引擎,用于在大规模数据集上执行数据工程、数据科学和机器学习任务。作为数据科学爱好者,您可能熟悉在本地机器上存储文件并使用Python对其进行处理,但是,本地机器有其局限性,无法处理大规模的数据集。要处理PB级的大规模数据集,仅了解Python框架是不够的。分布式处理是一种使用多台计算机来运行应用程序的方式,无需尝试在单台计算机上处理大型数据集,而是可以在相互通信的多台计算机之间分配任务。借助Spark,您可以实现单台计算机上不可能做到的事情,实现对PB级数据进行处理。

2023-12-09 17:51:25 1149 4

原创 第三期书生大模型实战营 第2关 Python 基础知识

Hello大家好,这里是第三期书生大模型实战营,闯关地图入门岛的第2关 Python 基础知识。我们将学会简单使用Python进行词频统计,并实现VSCode代码调试等。让我们开始吧~

2024-07-11 07:40:04 761

原创 第三期书生大模型实战营 第1关 Linux 基础知识

Hello大家好,这里是第三期书生大模型实战营,闯关地图入门岛的第1关 Linux 基础知识。我们将学会InternStudio开发机创建、配置远程连接、使用本地VSCode连接到开发机、创建脚本、创建虚拟环境、运行脚本等。让我们开始吧~

2024-07-10 06:40:51 1351

原创 书生·浦语大模型全链路开源体系-第7课

为了推动大模型在更多行业落地应用,让开发人员更高效地学习大模型的开发与应用,上海人工智能实验室重磅推出书生·浦语大模型实战营,为开发人员提供大模型学习和开发实践的平台。 本文是书生·浦语大模型全链路开源体系-第7课的课程实战。

2024-04-21 23:44:13 685

原创 书生·浦语大模型全链路开源体系-第6课

为了推动大模型在更多行业落地应用,让开发人员更高效地学习大模型的开发与应用,上海人工智能实验室重磅推出书生·浦语大模型实战营,为开发人员提供大模型学习和开发实践的平台。 本文是书生·浦语大模型全链路开源体系-第6课的课程实战。

2024-04-19 12:14:47 1109

原创 书生·浦语大模型全链路开源体系-第4课

为了推动大模型在更多行业落地应用,让开发人员更高效地学习大模型的开发与应用,上海人工智能实验室重磅推出书生·浦语大模型实战营,为开发人员提供大模型学习和开发实践的平台。 本文是书生·浦语大模型全链路开源体系-第4课的课程实战。

2024-04-17 18:26:49 1176

原创 书生·浦语大模型全链路开源体系-第5课

为了推动大模型在更多行业落地应用,让开发人员更高效地学习大模型的开发与应用,上海人工智能实验室重磅推出书生·浦语大模型实战营,为开发人员提供大模型学习和开发实践的平台。 本文是书生·浦语大模型全链路开源体系-第5课的课程实战。

2024-04-15 18:20:26 1423

原创 书生·浦语大模型全链路开源体系-第3课

为了推动大模型在更多行业落地应用,让开发人员更高效地学习大模型的开发与应用,上海人工智能实验室重磅推出书生·浦语大模型实战营,为开发人员提供大模型学习和开发实践的平台。 本文是书生·浦语大模型全链路开源体系-第3课的课程实战。

2024-04-12 18:13:45 1128

原创 书生·浦语大模型全链路开源体系-第2课

为了推动大模型在更多行业落地应用,让开发人员更高效地学习大模型的开发与应用,上海人工智能实验室重磅推出书生·浦语大模型实战营,为开发人员提供大模型学习和开发实践的平台。 本文是书生·浦语大模型全链路开源体系-第2课的课程实战。

2024-04-01 18:32:03 1463

原创 书生·浦语大模型全链路开源体系-第1课

为了推动大模型在更多行业落地应用,让开发人员更高效地学习大模型的开发与应用,上海人工智能实验室重磅推出书生·浦语大模型实战营,为开发人员提供大模型学习和开发实践的平台。

2024-03-28 18:26:04 788

原创 《PySpark大数据分析实战》-27.数据可视化图表Pyecharts介绍

大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第4节的内容:数据可视化图表Pyecharts介绍。

2024-01-10 13:44:17 1261 1

原创 《PySpark大数据分析实战》-26.数据可视化图表Seaborn介绍

大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第4节的内容:数据可视化图表Seaborn介绍。

2024-01-09 13:40:59 1335 2

原创 《PySpark大数据分析实战》-25.数据可视化图表Matplotlib介绍

大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第4节的内容:数据可视化图表Matplotlib介绍。

2024-01-05 13:36:20 1505 1

原创 《PySpark大数据分析实战》-24.数据可视化图表介绍

大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第3节的内容:数据可视化图表介绍。

2024-01-04 13:31:33 1190

原创 《PySpark大数据分析实战》-23.Pandas介绍DataFrame介绍

大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第2节的内容:Pandas介绍DataFrame介绍。

2024-01-03 13:44:19 879

原创 《PySpark大数据分析实战》-22.Pandas介绍Series介绍

大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第2节的内容:Pandas介绍Series介绍。

2024-01-02 13:44:07 877

原创 《PySpark大数据分析实战》-21.NumPy介绍数组的运算

大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第2节的内容:NumPy介绍数组的运算。

2023-12-27 13:46:12 897 2

原创 《PySpark大数据分析实战》-20.NumPy介绍数组的生成

大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第2节的内容:NumPy介绍数组的生成。

2023-12-26 13:16:47 840 2

原创 《PySpark大数据分析实战》-19.NumPy介绍ndarray介绍

大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第2节的内容:NumPy介绍ndarray介绍。

2023-12-25 22:50:46 911

原创 《PySpark大数据分析实战》-18.什么是数据分析

大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第1节的内容:什么是数据分析。

2023-12-23 16:25:52 1697 1

原创 《PySpark大数据分析实战》-17.云服务模式Databricks介绍运行作业

大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第5节的内容:云服务模式Databricks介绍运行作业。

2023-12-21 12:42:18 1031 2

原创 《PySpark大数据分析实战》-16.云服务模式Databricks介绍运行案例

大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第5节的内容:云服务模式Databricks介绍运行案例。

2023-12-20 23:03:07 1088

原创 《PySpark大数据分析实战》-15.云服务模式Databricks介绍创建集群

大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第5节的内容:云服务模式Databricks介绍创建集群。

2023-12-19 22:45:21 1264

原创 《PySpark大数据分析实战》-14.云服务模式Databricks介绍基本概念

大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第5节的内容:云服务模式Databricks介绍基本概念。

2023-12-18 23:02:58 1132 1

原创 《PySpark大数据分析实战》-13.Spark on YARN模式代码运行流程

大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第4节的内容:Spark on YARN模式代码运行流程。

2023-12-17 18:10:34 966

原创 《PySpark大数据分析实战》-12.Spark on YARN配置Spark运行在YARN上

大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第4节的内容:Spark on YARN配置Spark运行在YARN上。

2023-12-16 17:35:14 1498 1

原创 《PySpark大数据分析实战》-11.Spark on YARN模式安装Hadoop

大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第4节的内容:Spark on YARN模式安装Hadoop。

2023-12-16 16:57:24 1501

原创 《PySpark大数据分析实战》-10.独立集群模式的代码运行

大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第3节的内容:独立集群模式的代码运行。

2023-12-15 12:11:33 737

原创 《PySpark大数据分析实战》-09.Spark独立集群安装

大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第3节的内容:Spark独立集群安装。

2023-12-15 09:03:14 1294

原创 《PySpark大数据分析实战》-08.宽窄依赖和阶段划分

大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第2节的内容:宽窄依赖和阶段划分。

2023-12-14 13:19:47 912

原创 《PySpark大数据分析实战》-07.Spark本地模式安装

大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第2节的内容:Spark本地模式安装。

2023-12-14 13:17:29 1154

原创 《PySpark大数据分析实战》-06.安装环境准备

大家好!今天为大家分享的是《PySpark大数据分析实战》第2章第1节的内容:安装环境准备。

2023-12-13 22:45:41 1205 4

原创 《PySpark大数据分析实战》-05.PySpark库介绍

大家好!今天为大家分享的是《PySpark大数据分析实战》第1章第5节的内容:PySpark库介绍。

2023-12-12 11:44:48 1094

原创 《PySpark大数据分析实战》-04.了解Spark

大家好!今天为大家分享的是《PySpark大数据分析实战》第1章第4节的内容:了解Spark。

2023-12-12 11:24:39 1274

原创 《PySpark大数据分析实战》-03.了解Hive

大家好!今天为大家分享的是《PySpark大数据分析实战》第1章第3节的内容:了解Hive。

2023-12-11 22:43:13 1046

原创 《PySpark大数据分析实战》-02.了解Hadoop

大家好!今天为大家分享的是《PySpark大数据分析实战》第1章第2节的内容:了解Hadoop。

2023-12-11 22:27:50 1260 2

原创 《PySpark大数据分析实战》-01.关于数据

大家好!今天为大家分享的是《PySpark大数据分析实战》第1章第1节的内容:关于数据。

2023-12-09 23:21:33 1462

原创 大数据FusionInsightHD-05.HBase从C50迁移到6.5.1(01)迁移概述

项目上最近全新部署了FusionInsight HD 6.5.1大数据集群,并且希望将老集群FusinInsight HD C50的所有业务都迁移到新集群上。由于在老集群C50上的HDFS、HBase中存在有大量的业务数据,因此将业务从C50迁移到6.5.1的过程中,就需要将C50上的业务数据同步迁移到新集群6.5.1上。

2023-09-07 14:43:29 1411 11

原创 大数据FusionInsightHD-07.HBase从C50迁移到6.5.1(03)6.5.1上准备Loader

在FusionInsight HD集群的HBase数据迁移过程中,需要通过Loader将老集群FusinInsight C50上获取HBase的数据加载到新集群FusionInsight 6.5.1,因此需要在新集群FusionInsight 6.5.1中添加Loader以及具有相应权限的用户loaderUser。本文主要介绍如何在新集群FusionInsight 6.5.1中创建loaderUser用户以及如何添加配置Loader。

2023-09-05 12:06:28 615 6

原创 大数据FusionInsightHD-06.HBase从C50迁移到6.5.1(02)C50上准备FTP Server

在FusionInsight HD集群的HBase数据迁移过程中,需要通过FTP-Server从老集群FusinInsight C50上获取HBase的数据,因此需要在老集群FusinInsight C50中添加FTP-Server以及具有相应权限的用户ftpUser。本文主要介绍如何在老集群FusinInsight C50中创建ftpUser用户以及如何添加配置FTP-Server。

2023-09-04 12:02:41 752 2

Cars.zip

Cars.zip

2023-12-27

mongodb-1.15.zip

DataGrip连接MongoDB的驱动程序,1.15版本的。可用于连接MongoDB数据库,操作MongoDB数据库。

2023-03-13

PicGo-Setup-2.3.1.exe

一款比较优秀的图床工具,它是一款用 Electron-vue 开发的软件,可以支持微博,七牛云,腾讯云COS,又拍云,GitHub,阿里云OSS,SM.MS,imgur 等8种常用图床,功能强大,简单易用。非常适合做为博客文档中的插图图床。

2023-01-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除