基于python数据分析(分析篇八:关系数据库/整理数据)

一、关系数据库

	数据库就是一张表格或是一组表格,表格以某种方式对数据进行管理,是数据
之间的相互关系显而易见,数据库软件则对表格进行管理。

1.关系数据库管理系统
关系数据库管理系统(RDBMS)只最重要最有效的数据管理方式之一

RDBMS中每一行都有一把钥匙,通常称为ID(标识)

数据库所要求的表格之间的关系都是量化关系

SQL数据库相关知识,需要学习。

二、整理数据/井然有序

数据分析师,花在数据整理的时间是要比数据分析的时间。所以,数据整理的速度越快,工作就会完成的越快

  • 过程规划(准备)(保留原始数据,方便检查)
  • 修复数据
  • 整理数据(去除乱码;去除无法识别;去除重复等)
  • 正则表达式进行数据的批量处理
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值