自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 数据探索与可视化

在前面我们说到,所谓机器学习,就是用已知的数据通过算法去预测未来未知的数据。从结果中我们可以看到,SeaSurFaceTemp有3个缺失值,AirTemp有81个缺失值,Humidity有93个缺失值。、直方图、正态图等等,这些都是将单纯的数据以图像的形式呈现,从而可以起到更清晰有效地传达、沟通并辅助数据分析的作用。虽然我们已经知道了数据集中每列缺失值的数量,但是我们还不知道它们具体的分布情况(缺失值在哪一行)。于是,我们可以使用mano.matrix()可视化出缺失值在数据中的分布情况。

2024-05-11 16:42:37 189

原创 java语言中的循环语句

for循环的执行过程是:执行表达式1,计算表达式2,如果表达式2的值为true,执行循环体,执行表达式3,改变循环变量的值,再计算表达式2的值,如果是true,再进入循环体,形成循环,直到表达式2的值为false,结束循环,执行for后面的语句。do-while语句执行的过程是:执行循环体,计算布尔表达式的值,如果其值为true,再执行循环体,形成循环,直到布尔表达式的值变为false,结4束循环,执行do-while语句后的语句。使用do-while循环,计算1+2+3+...+100的和,并显示结果。

2023-12-08 11:01:38 27

原创 python数据分析的Pandas

Pandas是一个开源的Python库,提供了高性能、易于使用的数据结构和数据分析工具。Pandas的主要数据结构是Series(一维数据)和DataFrame(二维数据),它们可以处理各种类型的数据,如数值、字符串、时间序列等。Pandas库是基于NumPy的数组计算,提供了丰富的功能和高效的性能,使得它成为了数据分析中最常用的Python库之一一、认识pandas。

2023-12-06 20:36:10 268 1

原创 python数据分析的Numpy和Pandas

Numpy是Python进行科学计算,尤其是数据分析时,所用到的一个基础库。Numpy库的基础:Ndarray。Numpy数组的维数和元素数量由数组的型(shape)来决定,数组的型由N个正整数组成的元组来指定,元组的每个元素对应每一维的大小。数组的维统称为轴(axes),轴的数量被称作秩(rank)。Pandas是一个专门用于数据分析的开源Python库。pandas的核心为两大数据结构,分别是Series(一维)和DataFrance(多维)。

2023-12-05 15:00:04 97

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除