数据分析
文章平均质量分 73
晓之以理的喵~~
好好学习,天天向上
展开
-
大数据基本概念与应用场景
大数据基本概念与应用场景原创 2023-02-16 11:55:57 · 1884 阅读 · 0 评论 -
Hive数据倾斜的原因以及常用解决方案
Hive数据倾斜的原因以及常用解决方案原创 2023-02-10 10:34:56 · 6119 阅读 · 0 评论 -
常用的数据集成ETL工具有哪些?
六种常用的数据集成ETL工具原创 2023-02-07 09:55:23 · 2582 阅读 · 1 评论 -
数据仓库与数据湖的联系与区别
数据仓库与数据湖的联系与区别原创 2023-02-06 11:37:19 · 1436 阅读 · 0 评论 -
数据仓库的架构以及传统数据库与数据仓库的区别
数据仓库的架构以及传统数据库与数据仓库的区别原创 2023-02-04 13:47:11 · 2026 阅读 · 0 评论 -
数据库、数据仓库与数据湖的概念与基本特点
数据库、数据仓库与数据湖的概念与基本特点原创 2023-02-04 10:37:58 · 1116 阅读 · 0 评论 -
Hive架构组成与执行过程
Hive架构组成与执行过程原创 2022-09-28 10:56:16 · 2140 阅读 · 0 评论 -
Hive字符串函数--查找函数
Hive字符串查找函数原创 2022-08-19 15:58:11 · 3529 阅读 · 0 评论 -
正版数据库连接工具,DBeaver的安装与配置使用
DBeaver的安装与配置使用原创 2022-08-19 09:28:41 · 13547 阅读 · 1 评论 -
Hive字符串函数-空格处理
Hive字符串函数-空格处理原创 2022-08-16 13:35:22 · 6937 阅读 · 0 评论 -
Hive正则表达式
Hive正则表达式原创 2022-08-16 10:30:37 · 15073 阅读 · 0 评论 -
SQL中的字符串截取函数
字符串截取函数:left()、right()、substr()、substring_index() 函数原创 2022-08-08 14:48:30 · 28761 阅读 · 0 评论 -
Excel中text函数5中常用方法
Excel中text函数5中常用方法原创 2022-08-06 13:43:48 · 2796 阅读 · 0 评论 -
SQL 中delete与truncate的区别
SQL 中delete与truncate的区别原创 2022-07-20 14:10:19 · 3213 阅读 · 0 评论 -
SQL中对数据字段null值的处理
SQL中对null值的处理原创 2022-07-09 11:22:36 · 5443 阅读 · 0 评论 -
Hive数据库日期格式化
hive数据库日期格式化原创 2022-07-05 09:05:12 · 5045 阅读 · 1 评论 -
Hive数据表删除数据操作
Hive数据表删除数据操作原创 2022-07-04 13:11:52 · 22176 阅读 · 0 评论 -
Hive中 NTILE(n) 函数的使用
Hive中 NTILE(n) 函数的使用原创 2022-07-03 16:56:47 · 2109 阅读 · 0 评论 -
SQL查询结果按照指定内容排序
SQL查询结果按照指定内容排序原创 2022-04-30 10:32:36 · 19228 阅读 · 7 评论 -
Python13--数据分析Pandas库进阶二
一、层级索引下面创建一个Series, 在输入索引Index时,输入了由两个子list组成的list,第一个子list是外层索引,第二个list是内层索引。示例代码:# 导入numpy,别名npimport numpy as np# 导入pandas,别名 pdimport pandas as pdser_obj = pd.Series(np.random.randn(12),index=[ ['a', 'a', 'a', 'b', 'b', 'b', 'c原创 2021-03-21 16:27:56 · 482 阅读 · 4 评论 -
Python09--数据分析基础
数据分析基础与Numpy库、Pandas和数据可视化的使用基础总结原创 2021-03-15 14:15:16 · 316 阅读 · 1 评论 -
Python10--数据分析Numpy库
一,含义提供了一个在Python中做科学计算的基础库,重在数值计算,主要用于多维数组(矩阵)处理的库。用来存储和处理大型矩阵,比Python自身的嵌套列表结构要高效的多。本身是由C语言开发,是个很基础的扩展,Python其余的科学计算扩展大部分都是以此为基础。NumPy数组是一个多维的数组对象(矩阵),称为ndarray,具有矢量算术运算能力和复杂的广播能力,并具有执行速度快和节省空间的特点。ndarray的下标从0开始,且数组里的所有元素必须是相同类型。二,ndarray的创建1、ndarray的原创 2021-03-15 14:16:30 · 358 阅读 · 1 评论 -
Python11--数据分析Pandas库基本概念
一,含义Pandas的名称来自于面板数据(panel data)和Python数据分析(data analysis)。Pandas是一个强大的分析结构化数据的工具集,基于NumPy构建,提供了 高级数据结构 和 数据操作工具,它是使Python成为强大而高效的数据分析环境的重要因素之一。特点: (1)一个强大的分析和操作大型结构化数据集所需的工具集 (2)基础是NumPy,提供了高性能矩阵的运算 (3)提供了大量能够快速便捷地处理数据的函数和方法 (4)应用于数据挖掘,数据分析 (5)提供数原创 2021-03-21 00:57:32 · 658 阅读 · 8 评论 -
Python12--数据分析Pandas库进阶一
一、Pandas的函数应用1,apply 和 applymap(1)可直接使用NumPy的函数示例代码:# 导入numpy,别名npimport numpy as np# 导入pandas,别名 pdimport pandas as pd# Numpy ufunc 函数df = pd.DataFrame(np.random.randn(5,4) - 1)print(df)print(np.abs(df))显示结果:(2)通过apply将函数应用到列或行上指定轴的方向,默认原创 2021-03-21 14:05:27 · 814 阅读 · 4 评论
分享