自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 echarts学习篇

文本块的位置和旋转:position、distance、rotate。option = { title: { text: '圆环图的例子', left: 'center', top: 'center' }, series: [ { type: 'pie', data: [ { value: 335, name: 'A' }, { value: 234, name: 'B' }, { value: 1548, name: 'C' } ], radius: ['40%', '70%'] } ] };

2024-05-28 02:10:31 810 1

原创 【mysql学习笔记】

/*创建视图:从学生表,课程表,选课表,对选择了python课程的所有学生信息*/

2024-05-07 23:14:18 1149 1

原创 【平台搭建+数据处理+数据可视化】

第一部分:大数据平台搭建

2024-05-07 22:59:20 788

原创 杂谈收获和体会

搭建平台是最让我感受到小事修炼心性,后来不断学习没学过的领域的时候我会觉得难事磨砺心智,我觉得每个语言都是不一样的存在,他就像刷怪一样,刷过了可以开心好几天,如若没有会纠结难过很多天,不过这也大大的磨炼了我的心智。开始入坑的时候我会很好奇大家如何去学习计算机的内容,csdn是一个很好的平台在我的学习过程中解决了我的不少问题,大佬云集的地方,让我不断得到提升,我也很感激互联网的强大,能够在此学了许多,这几年收获了很多,也错失了很多机会,我希望未来的我能够不断提升自我,对自己说:“强大了!

2024-04-19 15:02:00 275 2

原创 大数据开发语言Scala—RDD

(1).需要转化的集合:须是seq集合,seq代表序列,指的是一类具有一定长度的可迭代访问的对象,其中每个数据元素均有一个从0开始的、固定的索引。makeRDD的使用方式有两个,一种是和parallelize一样,另外一种是根据数据大小思考分区。(2).分区数,若不设分区数则rdd的分区数默认为该程序分配到的资源的cpu核心。将原rdd里和参数rdd相同元素去掉。一、从内存中读取数据创建RDD。二、从外部中读取数据创建RDD。使用map方法转换数据。转换数据,分割合成1维。求出rdd的共同元素。

2024-04-19 14:16:35 480 2

原创 【spark数据处理】文件上传+文件读取+文件筛选

对多列进行分组,并对每组进行聚合计数,这段代码首先创建了一个SparkSession实例,然后创建了一个包含三列("columnName1", "columnName2", "col")的DataFrame。hadoop fs -put /data/wenjian1.csv /data //上传文件。方法按照"columnName1"和"columnName2"进行分组,然后调用。函数计算"col"列的平均值,将结果列命名为"m"。select 选择 :可以选择指定行,指定类,并且可以重名。

2024-04-16 00:00:00 1520 3

原创 【Seaborn 库数据可视化】常用图形类型

除了以上几种常见的统计图形类型,Seaborn还提供了其他一些更高级的图形类型,如密度图(Density plot)、面积图(Area plot)和小提琴图(Violin plot)等。直方图将数值范围分成多个间隔(bin),并计算每个间隔内的观测值数量。函数可以绘制箱线图,用于展示一组数据的分布情况,包括中位数、四分位数和异常值等。函数可以绘制折线图,用于展示连续变量随着另一个变量的变化而变化的趋势。函数可以绘制热力图,用于展示两个分类变量之间的相关性。函数可以绘制柱状图,用于展示分类变量之间的比较。

2024-04-15 00:51:16 653 1

原创 下载后repo要执行什么来安装mysql

yum install -y .... -nogpgcheck (...刚刚找里面的server的软件包)yum search mysql (找里面的server的软件包)

2024-04-14 15:50:56 155 1

原创 【pandas数据处理及分析】

1.查询数据在pandas中,可以使用以下方法查找数据:这些方法可以根据不同的需求选择和组合使用,以实现对数据框中特定数据的查找和筛选。2.删除某列或某行代表标签所在级别,默认为none在pandas中,可以使用以下方法删除某列或某行:其中,'column_name'为要删除的列名,axis=1表示按列操作,inplace=True表示在原始数据上进行修改。其中,row_index为要删除的行索引,axis=0表示按行操作,inplace=True表示在原始数据上进行修改。

2024-04-14 15:42:25 1550 1

原创 【From zero to one study Matlplotlib绘图】

它接受一个字典作为参数,字典的键为参数名,值为参数的值。上界(Upper Whisker):一般为Q3加上1.5倍的IQR,用于标记数据集的上边界。下界(Lower Whisker):一般为Q1减去1.5倍的IQR,用于标记数据集的下边界。edgecolors:表示散点的边缘颜色,默认值是'face'(与散点的颜色相同)。数据集:箱线图是基于一组数据集绘制的,这些数据可以是连续或离散的数值。四分位距(IQR):Q3和Q1之间的差值,用于衡量数据的离散度。箱线图是一种用于显示数据分布情况的可视化图表。

2024-04-11 00:59:13 903 1

原创 【数据挖掘之数据可视化】Matplotlib图表绘制基础

Jupyter notebook中进行交互式绘图,需要执行%matplotlib notebook这个命令。习惯上我们会使用import matplotlib.pyplot as plt来进行导入matplotlib.pyplot模块。tips(若没有图案出来一定要检查是否执行了%matplotlib notebook这个命令)

2024-04-08 20:12:38 384

原创 【Python数据挖掘 -Pandas】serise与dataframe

Pandas是一个开源的Python库,用于数据分析和数据处理。它提供了数据结构和函数,使得处理结构化数据变得更加简单和高效。Pandas最常用的数据结构是DataFrame,类似于表格或电子表格,可以将数据组织成行和列。Pandas还提供了许多用于数据操作、数据清洗、数据转换和数据分析的功能,使得用户可以更轻松地处理和分析大量的数据。Pandas还可以和其他Python库如NumPy和Matplotlib等一起使用,方便进行数据分析和可视化。

2024-04-08 13:21:14 155

原创 【numpy数据统计与分析】

在numpy中,数组运算更加快速并且简洁尤其在于处理数据方面。

2024-04-08 02:36:29 241

原创 【python数据挖掘之numpy】数组合并+切片+索引

numpy提供hsplit()、vsplit()、 split()数组合并是数据处理中需要经常使用到的,numpy利用hstack() vstack() concatenate()函数来完成数组的合并。2.4 np.column_stack():按列方向堆叠一维数组为二维数组。2.5 np.row_stack():按行方向堆叠一维数组为二维数组。2.3 np.hstack():按水平方向(列方向)堆叠数组。2.2 np.vstack():按垂直方向(行方向)堆叠数组。4.1 索引和切片(一维)

2024-04-08 01:57:56 393

原创 【大数据学习】数据平台搭建之hadoop

Hadoop是一个开源的分布式计算框架,用于存储和处理大型数据集。(前提在于已完成ssh免密,jdk等安装后进行的hadoop平台基本配置搭建)

2024-04-08 00:36:42 409

原创 【python数据挖掘之numpy】-数组及对象属性和数据转换

Numpy是一个Python库,用于处理多维数组和矩阵,以及针对这些数组执行数学运算的函数。它提供了高效的数组对象和相关的操作,可以用于快速处理大量数据。Numpy的主要功能包括:创建数组、数组运算、数组索引和切片、线性代数、随机数生成等。Numpy在科学计算、数据分析、机器学习等领域都广泛应用。tips:(本博文在jupyter中实训)

2024-04-07 18:44:24 1153

原创 【Python用工版学习笔记】Free for you

名称函数具体说明在列表中找出某一个值第一个匹配项的索引位置统计某个元素在列表出现的次数在列表末尾增加新的元素将对象插入列表在列表末尾一次性追加多个另个序列中的多个值(用新列表拓展原列表)移除列表中某个值的第一个匹配项移除列表中的一个元素。

2024-04-06 13:47:31 1134 2

【Seaborn 库数据可视化】常用图形类型

【Seaborn 库数据可视化】常用图形类型

2024-04-15

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除