深入浅出数据分析-读书笔记

概要

本书是说明类的类型,主要内容是告诉我们该如何做数据分析。主要从一下几个方面进行阐述:

1数据分析的过程

确定问题-分解问题(将一个大问题分解为几个小问题)-评估(对每个问题使用数据评估)-决策 (循环执行这四个过程)。验证理论需要进行实验对比,检验理论(要注意对照组的设置)。

2数据图形化

  • 散点图: 找出数据的规律和特征。可以用来查看数据的总体分布趋势,探索原因。
  • 如何展示多种变量的关系:将多张相似的散点图相邻排放。

3假设检验:

  1. 列出各种可能。
  2. 利用证据排所有的不可能的假设。证伪法。
  3. 排出没有用的证据,然后考虑证据的诊断性,即时相对似然性。给剩下的的可能性排序。
  4. 具有新的证据之后重新进行检测。

4贝叶斯统计。

基础概率随着实验的进行会不断变化。

5主观概率。

将概率使用具体的数字描述,能减少分歧。

6线性回归

  • 线性回归可以将数据分区,提高进度。
  • 分隔的目的也有助于管理误差
  • 线性回归预测需提供提供均方根提供误差范围和描述数据范围。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值