- 博客(14)
- 收藏
- 关注
原创 Python基础及Numpy库
前面1-6题都很基础,基本在课上就做过了,后面的扩展练习,就需要多动脑子,去思考,思考不出来,嘿嘿,会去百度搜索。找一段英文,编写程序,对文中所出现的单词的频次进行统计,并按照单词频次从高到低输出频次统计表,统计时,请注意区分大小写。现有列表元素,[‘干饭1’,’干饭2’,‘干饭3’,‘干饭4’,‘干饭 5’],请返回‘干饭3’这个值的索引值。现有数组[‘红鲤鱼’,‘红鲤鱼’,‘绿鲤鱼’,‘绿鲤鱼’,‘与鱼’],请将该数组去重显示。现有列表元素,[‘专业’,‘据’,‘数’,‘大’,‘级’,‘2020’]
2023-10-04 11:23:02 621 2
原创 数据可视化-豆瓣影评数据分析(FineBI)
一、实验(实训)目的 1.熟悉FineBI界面、菜单栏、函数的使用等;、 2.独立完成可视化项目,熟悉内容数据及业务流程; 3.完成豆瓣影评自主数据集处理,并形成可视化面板及数据分析结论。虽然电影的数量在逐年递增,但是质量却是下滑,可以看到电影行业重量而不重质的现状;也反映了人们对于电影的要求不断提高。中国大陆电影质量良莠不齐,高分电影不少,但低分电影占多数,在提升电影质量上还有很长的路要走。
2022-10-22 20:06:12 5779 29
原创 Windows如何上传文件到虚拟机(自带)
一、如何上传文件方法1:使用SecureFX方法2:使用虚拟机自带的共享文件方法3:…… 二、开始方法2介绍流程:在开启用户的过程中点开虚拟机栏目下的重新安装 VMware Tools
2022-10-15 17:06:00 5331 5
原创 NBA球星数据可视化分析-FineBI
一、实验(实训)目的 1.熟悉FineBI界面、菜单栏、函数的使用等;、 2.独立完成可视化项目,熟悉内容数据及业务流程; 3.完成NBA球星数据可视化分析自助数据集处理,面板板块设计草图制作,并形成可视化面板及数据分析结论。二、实验(实训)原理或方法 使用下发的“NBA数据分析活动数据包”中Excel表格数据完成相应的实验。三、仪器设备、材料 计算机、FineBI工具
2022-10-08 10:45:22 3206 5
原创 新冠肺炎疫情数据可视化分析-FineBI
一、实验(实训)目的 1.熟悉FineBI界面、菜单栏、函数的使用等;、 2.独立完成可视化项目,熟悉内容数据及业务流程; 3.完成新冠肺炎疫情自助数据集处理,并形成可视化面板及数据分析结论。
2022-10-06 20:03:51 4217 17
原创 数据可视化-pyecharts库
一、实验(实训)目的 1.掌握pyecharts的下载与安装; 2.掌握pyecharts的使用; 3.了解pyecharts库中基本图表的制作方式。二、实验(实训)原理或方法 Python第三方库的调用;图形可视化思维。
2022-10-05 20:55:14 998 6
原创 habase安装配置
1、上传2、hbase文件配置1)在27行增加java的安装路径(jdk路径)(27行)2)把文件46和47行的permSize注释掉(46和47行)3)在120行设置HBASE_PID_DIR的路径(120行)4)在128行设置 HBASE_MANAGES_ZK的值(128行)5)配置hbase-site.xml文件6)配置regionservers文件7)同步文件8)在系统文件下配置hbase.sh文件9)重启机器使之生效。10) 启动habas
2022-09-27 18:17:16 2813 1
原创 Flink 独立集群安装
1、学习Flink历史及现状 2、了解Flink相关术语及知识 3、能够Flink独立集群安装配置 flink 截图: 配置 flink-conf.yaml 配置 workers 配置 master 配置 slaves
2022-09-24 18:26:01 1146
原创 xsync脚本的完整版和Hadoop集群启动脚本
1、优点:rsync主要用于备份和镜像。具有速度快、避免复制相同内容和支持符号链接的优点。2、区别:rsync和scp区别:用rsync做文件的复制要比scp的速度快,rsync只对差异文件做更新。scp是把所有文件都复制过去
2022-09-23 19:45:26 1426 4
原创 ZooKeeper 3.4.13配置安装
① 进入目录:# cd /opt/software/zookeeper-3.4.13/conf/(此路径为存放自己虚拟机中zookeeper的路径,conf/为zookeeper配置文件的路径) ② 复制文件:# cp zoo_sample.cfg zoo.cfg
2022-09-23 09:49:31 1490
原创 集群配置 hadoop-3.1.3 版本
如果集群是第一次启动,需要在hadoop102节点格式化NameNode(注意:格式化NameNode,会产生新的集群id,导致NameNode和DataNode的集群id不一致,集群找不到已往数据。如果集群在运行过程中报错,需要重新格式化NameNode的话,一定要先停止namenode和datanode进程,并且要删除所有机器的data和logs目录,然后再进行格式化。
2022-09-22 13:11:20 1807 2
原创 DataFrame数据的查询和编辑
通过列索引标签或者属性的方式可以单独获取DataFrame的列数据,返回数据类型为Series。在选取列时不能使用切片的方式,超过一个列名用df[['列名1','列名2']]
2022-09-22 08:41:45 1719
原创 HADOOP系统安装
花费了许久时间,删除安装,创建又创建,终于做好了,但有些地方还不懂,照着书本敲,感觉有点生搬硬套。总得来说,旅途遥远,还需努力。
2022-09-21 21:53:53 492
原创 HADOOP系统安装环境准备
一、实验(实训)目的 1、掌握HADOOP平台安装前的环境准备,包括版本准备、虚拟机安装、CENTOS7安装等;二、实验(实训)原理或方法1、完成版本的拷贝和准备,额外要求对本次课程所需要的所有文件进行目录归类; 2、完成虚拟机的安装、CENTOS7的安装,IP地址的配置等;
2022-09-21 20:36:09 602
数据可视化-新冠肺炎疫情可视化分析-finbi
2022-10-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人