自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 初学者,Matplotlib-Day16

是一个用于 Python 的绘图库,它提供了丰富的绘图接口,可以用来绘制各种静态、动态、交互式的图表和可视化效果。它是 Python 数据科学、机器学习和可视化领域中最常用的库之一。Matplotlib 是一个非常强大的 Python 画图工具,我们可以使用该工具将很多数据通过图表的形式更直观的呈现出来。Matplotlib 可以绘制线图、散点图、等高线图、条形图、柱状图、3D 图形、甚至是图形动画等等。

2024-05-16 00:14:04 536

原创 初学者,了解Pandas-Day15

是一个开源的Python库,是基于NumPy的一种工具,提供了数据结构和数据分析工具,使得Python可以更轻松地处理数据。Pandas的主要数据结构是Series和DataFrame,它们可以用来处理不同类型的数据,如数值型、字符串型、时间序列等。Pandas包含了许多功能,如数据清洗、数据转换、数据合并、数据过滤等,使得数据处理变得更加简单和高效。该库常用于数据分析、数据可视化、机器学习等领域。Windows下安装(运行管理员模式的终端):pip install pandas。

2024-05-08 23:38:49 655 1

原创 初学者,学习Jupyter 、Numpy-Day14

Jupyter Notebook是Jupyter项目的一个子项目,是一个开源的网络应用程序,一个基于Web的交互式计算环境,可以用于创建和共享文档,包含实时代码、可视化结果和文本说明。Jupyter Notebook是一个强大的工具,可以支持多种编程语言,如Python、R、Julia等。用户可以在笔记本中编写代码,运行代码单元,并即时查看结果;还可以添加Markdown文本、图像、表格、链接等内容,使得文档更加丰富和易于理解。

2024-05-07 23:39:39 835

原创 初学者,了解大数据、Hadoop、Hive-Day13

虽然大数据与 Hadoop 关系密切,但 Hadoop 并不等同于大数据,大数据也不是指 Hadoop,大数据代表的是一种理念、一种解决问题的思维、一系列技术的集合,Hadoop 只是其中一种具体的处理数据的技术框架,目前比较流行的 Spark、Flink 等实时计算框架也属于大数据技术。2.HQL用起来和SQL非常的类似,Hive在执行的过程中会将HQL转换为MapReduce去执行,所以Hive其实是基于Hadoop的一种分布式计算框架,底层仍然是MapReduce。

2024-04-29 01:09:01 956

原创 初学者,继续学习SQL-Day12

获取左表(join 前边的表)的全部(记录)数据,右表(join 后边的表)做补充(能关联就显示数据,不能关联就为null);create procedure 存储过程名([参数1 类型1,参数2 类型2,....])局部变量赋值:自定义函数和存储过程内declare 声明的变量,自定义函数和存储过程的定义时的参数名。create function 函数名([参数名1 参数类型1,参数名2 参数类型2,....])curdate(),concat("a","b"),year(curdate());

2024-04-24 22:51:28 911

原创 学习SQL指令,Day11

如: select DateDiff(CURDATE(),"2024-4-1"),timestampdiff(day,"2024-4-1",CURDATE()),不在列表中: 字段名 not in(值1,值2,....)====== 字段名!=值1 and 字段名!在列表中: 字段名 in(值1,值2,....)====== 字段名=值1 or 字段名=值2 or ...

2024-04-21 16:12:24 725 1

原创 初学者,了解数据库Day10

安装客户端DBeaver,DBeaver是一个通用的数据库管理工具和SQL客户端,支持MySQL,PostgreSQL,0racle,DB2,MSSQL,Sybase,Mimer,HSQLDB,Derby,以及其他兼容JDBC的数据库。数据库(Database)是按照数据结构来组织、存储和管理数据的仓库,保存有组织的数据的容器(通常是一个文件或者一组文件)。数据定义语言:定义一个数据库,定义一个表,删除数据库,删除表,修改表结构(列名,列类型,列顺序)SQL 是用于访问和处理数据库的标准的计算机语言。

2024-04-15 17:58:34 429 1

原创 初学者,了解DAX-Day09

一身转战三千里,一剑可当百万师」,DAX 是一门强大的语言,它让没有任何 IT 背景的普通人借助 Excel 这样的平民工具就可以处理几百万、上千万行的数据;借助 DAX,普通业务人员对数据的分析能力将可以实现质的飞跃,还可以更容易的从 Excel 切换到 SSAS 这样的企业级 BI 工具。DAX 不是一门轻易就可以掌握的语言,需要学习它的理论,并通过做题来反复实践,在这个过程中你的认知会一次次的建立,又一次次被推翻,不要灰心,这是所有初学者的必经之路,你并不孤独。货币数据类型存储固定的十进制数。

2024-04-14 23:46:24 817 1

原创 了解数据分析

数据分析师让企业能够通过可视化和报告工具来最大限度地增加其数据资产的价值。他们还负责分析、清除和转换数据。此外,还负责设计和构建可缩放的高性能数据模型,在报表中启用和实现高级分析功能,用于分析报表。数据分析师会与相关利益干系人合作来确定合适且必要的数据和报告要求,然后将原始数据转换为相关且有意义的见解。想要成为一名数据分析师,于是踏上了漫漫探索之旅。了解数据分析的关键概念将帮助你和你的团队开始探索并充分利用数据。数据分析是标识、清除、转换和建模数据的过程,用于发现有意义和有用的信息。

2024-04-12 16:46:44 983

原创 初学者,Power Query函数Day07

SUMMARIZE():函数可以实现对既定表格的分组,生成分组信息表(不重复多层分组信息)同时还可以基于分组信息进行汇总计算,它返回的是一张表;迭代函数:是在统计函数后加一个X,Sumx(表,表达式),迭代是表的逐行扫描(迭代),其内容是计算表达式的值,扫描完成后再统计。最大值= Max(‘表’[字段名])最小值= Min('表'[字段名])记录数= Countrows('表’),“新列名”,[列表达式])数据筛选---保留---删除---去重---缺失值、错误值处理---文本处理---时间日期处理。

2024-04-11 21:02:06 1023 1

原创 初学者,PowerBI Day06

销售额月环比 = if(SUM('销售表'[销售额]) >0, DIVIDE(SUM('销售表'[销售额]) - CALCULATE(SUM('销售表'[销售额]), DATEADD('销售表'[订单日期].[Date], -1, MONTH)),CALCULATE(SUM('销售表'[销售额]), DATEADD('销售表'[订单日期].[Date], -1, MONTH)))- Power BI提供一个自助式的BI工作环境,可以从各种数据源中提取数据并进行整理分析,最后生成可视化报表。

2024-04-10 13:24:51 568 1

原创 Excel项目-学科调整决策

对于已有的n条数据表格进行操作分析。

2024-04-07 01:06:54 348

原创 初学者,数据可视化---“一图胜千言”Day04

数据永远是枯燥的,但图形图像是具有生动性的。数据可视化是一个相对的概念,它通过将数据转换为标识从而为人们提供帮助与指导,并最终成为通过数据分析传递信息的一种重要工具。与传统的立体建模之类的特殊技术方法相比,数据可视化所涵盖的技术方法要广泛得多,它是利用计算机图形学及图像处理技术,将数据转换为图形或图像形式显示到屏幕上,并进行交互处理的理论、方法和技术。它涉及计算机视觉、图像处理、计算机辅助设计和计算机图形学等多个领域,并逐渐成为了一项研究数据表示、数据综合处理、决策分析等问题的综合技术。

2024-04-06 00:26:15 934

原创 初学者,数据透视表Day03

是一种可以快速汇总、分析大量数据表格的交互式分析工具。使用数据透视表可以深入分析数值数据,以帮助用户发现关键数据,并作出有关企业中关键数据的决策。>首先数据的表格不能有合并单元格,不能有空值,选中所要操作的数据Ctrl+C查看是否有空值。

2024-04-05 15:40:25 227 1

原创 初学者,数据的提取Day02

看到一句话是这样说的:“Excel在过去、现在和未来都是一个无比优秀和天才的工具,无数虔诚的信徒将其奉为唯一的法门,而我却并不在其中。”我承认之前确实是有点轻蔑Excel的,觉得简单的表格不是右手就行吗,直到现在开始认真的去探究,发现确实自己只知道它里面百分之一的东西。学习数据筛选和提取:日期提取---从文本中提取信息---数值数据---关联表---if条件。- Averageifs:查找一组给定条件指定的单元格的平均值(算术平均值)。统计函数:计数---求和---求平均值---最大值---最小值。

2024-04-02 22:31:29 379

原创 初学者,数据分析思维Day01

直到有一天,机器人要上线的前两天我们开始测试,所有人坐在一起解决问题,那是我第一次见到那么庄重的场面,一间很大的会议室坐着很多 算法工程师,我们测试出问题他们开始用很专业的话语说着解决方案并开始操作,当时我的心里是受到些许震撼的,他们解决问题的速度很快很专业,那天晚上我就在想自己真正想要的是什么。学习数据分析思维:首先需要明确分析的目的----然后是数据的采集----数据的处理(清洗,集成,归约,变换)----数据的分析与建模----数据可视化----提出建议。首先需要一种极客精神,保持主动,保持思考!

2024-03-31 13:58:42 310 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除