数据分析(一)认识数据,数据处理,数学基础

本文介绍了数据分析的基础知识,包括数据对象的属性类型(如标称、二元、序数、数值属性)、统计指标(如均值、众数、分位数)以及数据可视化的常用图表。此外,还探讨了数据处理的重要性(如数据清洗、合并、规约)和数学基础,如行列式、矩阵及其运算。
摘要由CSDN通过智能技术生成

一、认识数据

1、数据对象和属性类型

数据对象 Data Objects

  • 数据集由数据对象组成
  • 一个数据对象代表一个实体(entity)
    • 销售数据库:顾客,商品,销售
    • 医疗数据库:患者
    • 大学数据库:学生、教授、课程
  • 数据对象又称为样本、实例、数据点或对象
  • 数据对象用属性(attribute)描述
  • 行代表着不同的样本,列代表着不同的属性

属性 Attributes

  • 属性(attribute)是一个数据字段,表示数据对象的一个特征
    • 如:customer_ID,name,address
  • 类型:
    • 标称属性
    • 二元属性
    • 序数属性
    • 数值属性

属性类型 Attribute Types

  • 标称属性(nominal attribute)
    • 其值是一些符号或者事物的名称。
      • 如:头发的颜色,人的姓名。
  • 二元属性(binary attribute)
    • 是一种特殊的标称属性,只有两个状态:0或1.
    • 对称的:两种状态具有同等价值,携
  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值