自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 数据可视化-例子

第三章第一章数据可视化是为了从数据中寻找三个方面的信息:模式、关系和异常模式:指数据中的规律。关系:指数据之间的相关性。异常:指有问题的数据。第二章视觉感知:指客观事物通过人的视觉器官在人脑中形成的直接反映,人类只有通过“视觉感知”才能达到“视觉认知”接近原则:人在进行视觉感知时会把距离上相互靠近的元素视作一个整体分类算法:从数据中选出已经分好类的训练集,在此训练集上运用数据挖掘分类技术,构造一个分类模型,然后再根据此分类模型对数据集中未分类的数据进行分类。

2024-05-25 00:29:36 1329

原创 Python-判定语句

2.只可被 2 整除。3.只可被 3 整除。4、if 嵌套语句 随机输入一个数判定是否能被 2 和 3 整除。1.可同时被 2 和 3 整除。1、输入不同的节日信息,输出相应的结果。2、输入不同的年龄,输出相应信息。3、编写程序,进行核酸检测输出。输出:错误信息,请重新输入。4.不能被 2 和 3整除。输出:别动,马上送院治疗。输出:每天都是节日啊~输出:送苹果,看电影。输出:生日应该买蛋糕。

2024-05-17 00:07:13 119

原创 NoSQL数据库原理与应用-MongoDB基础

例如,如果想保住文档的“name”键都有不一样的值,创建一个唯一索引就好了:db.people.createIndex({“name”:1},{“unique”:true})索引数据存储在内存当中,同样加快了索引查找数据的效率。3、db.user.find({“name”:“jack”}) 想匹配一个字符串,“name”的值为“jack”的。在一个键上创建的索引就是单键索引,单键索引是最常见的索引,如MongoDB默认创建的_id的索引就是单键索引。

2024-05-16 22:25:40 539

原创 大数据预处理技术:第一章:数据预处理总述

用于帮助从原有庞大数据集中获得一个精简的数据集合,并使这一精简数据集保持原有数据集的完整性,这样在精简数据集上进行数据挖掘显然效率更高,并且挖掘出来的结果与使用原有数据集所获得结果是基本相同。在现实场景中,数据集是很庞大的,数据是海量的,在整个数据集上进行复杂的数据分析和挖掘需要花费很长的时间。在数据库中是指在不同地方存储和使用的同一数据应当是等价的,表示数据有相等的值和相同的含义。数据的时效性很大程度上制约着决策的客观效果。由于重复录入,并发处理等不规范的操作,导致产生不完整,不准确的,无效的数据。

2024-05-15 20:52:42 686

原创 大数据可视化技术-习题答案

格式塔原则最基本的法则是简单精炼法则,它认为在观察时,人们会用一种常规的、简单的、相连的、对称的或有序的形式来感知和解释模糊不清或复杂的图像。能够很好地呈现比例数据随着时间的变化情况,不仅可以看到整体的变化趋势,也可以看到其中每一类的变化情况。数据到可视化的直观映射;C.数据快速动态变化,常以流式数据形式存在,需要寻找流式数据的实时分析与可视化方法。B.在数据获取与分析处理过程中,易产生数据质量问题,需要特别关注数据的不确定性。离散型数据:又称为不连续数据,在任何两个数据点之间的个数是有限的。

2024-05-15 13:37:29 2617

原创 数据可视化之广电大数据

1、随着科技的发展,现在人们观看电视节目的方式越来越多,给人们带了很多便利。人们不仅可以使用传统的电视机观看电视节目,而且可以通过网络观看电视节目,这样使得运营商、用户、网络之间产生了一些交互关系。为了更改的为用户提供服务,并提高收益和收视率,需要对广电数据进行分析。

2023-04-27 21:43:47 737

原创 spark:实验报告

虚拟机:账号:node1、密码:123456finalshell:连接node1。注意ID号要一致。

2023-04-17 19:55:28 616

原创 数据可视化实战之新零售--完整代码

'设备编号' '下单时间' '订单编号' '购买数量(个)' '总金额(元)' '支付状态' '出货状态' '购买用户' '市' '商品名称']2 112636 2018-04-30 22:35:00 112636qr15250989343846 ... 22 4 晚上。data['商品详情'] = data['商品详情'].str.replace(i, '')

2023-04-07 20:23:01 122

原创 数据可视化实战之新零售

PyCharm Community Edition 2021.3.3---操作。

2023-04-07 18:02:40 1982

原创 可视化项目

可视化项目

2023-03-23 16:56:02 332

原创 数据挖掘学习

数据挖掘

2023-03-22 18:15:11 28

原创 spark--学习内容

删除解决方案关闭Hyper-v服务管理员身份打开CMD重启电脑,运行vm即可恢复Hyper-v服务账号:node1 密码:123456pysparkspark的官网。

2023-03-22 15:35:13 32

原创 实验6 flume 基础练习

hadoop

2022-07-11 13:41:36 58

原创 Telnet 安装

hadoop

2022-07-11 13:39:56 108

原创 hive--安装

hive 安装

2022-06-07 22:11:21 26

原创 Hadoop-集群环境搭建

集群环境搭建

2022-06-07 17:09:18 25

原创 Hadoop-shell命令////Hbase-shell命令

hadoop-shellhbasd-shell

2022-06-07 16:04:11 40

原创 Hadoop--相关知识

知识点

2022-06-07 15:14:47 31

原创 MySQL

建议用大写,在这里输入可以不用 (;)1.准备工作CREATE TABLE `emp_02` (`id` int DEFAULT NULL COMMENT '员工年龄',`name` varchar(10) DEFAULT NULL COMMENT '员工姓名',`age` int DEFAULT NULL,`dep` varchar(10) DEFAULT NULL COMMENT '员工所属部门',`addr` varchar(10) DEFAULT NULL COMMEN.

2022-05-05 23:42:09 35

数据挖掘与机器学习资料

数据挖掘与机器学习资料

2024-05-25

数据预处理-期末考试资料

数据预处理-期末考试资料

2024-05-16

数学建模-基金-模糊-综合评价

数学建模-基金-模糊-综合评价

2024-05-16

NOSQL-数据库原理

NOSQL-数据库原理

2024-05-16

Hnase课程-概念资料

Hnase课程-概念资料

2024-05-16

NOSQL-课程复习资料

NOSQL-课程复习资料

2024-05-16

数据分析-NOSQL测试题

数据分析-NOSQL测试题

2024-05-16

复杂数据预处理-kettle

复杂数据预处理-kettle

2024-05-16

数据预处理-课程实验报告

数据预处理-课程实验报告

2024-05-16

数据预处理-课程复习资料

数据预处理-课程复习资料

2024-05-15

计算机网络基础期末资料

计算机网络基础期末资料

2024-05-15

数据可视化-广电大数据-实验报告

数据可视化-广电大数据-实验报告

2024-05-15

spark课程复习资料

spark课程复习资料

2024-05-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除