文章目录
1. 使用 Python 验证数据集中的体温是否符合正态分布。
- 数据集地址:http://jse.amstat.org/datasets/normtemp.dat.txt
- 数据集描述:总共只有三列:体温、性别、心率
- 数据集详细描述:
1 - 5 Body temperature (degrees Fahrenheit)
9 Gender (1 = male, 2 = female)
14 - 15 Heart rate (beats per minute)
根据数据,主要利用python 分析以下问题:
1. 人类体温均值真的是98.6F吗?
2. 体温样本数据是否服从正态分布?
3. 不正常的体温是多少?
4. 男性和女性的正常体温有明显的区别吗?
5. 体温和心率是否有相关性?
导入数据
首先导入数据,之后在此数据的基础上做各种分析
import requests
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
# 1 下载到本地
re = requests.get("http://jse.amstat.org/datasets/normtemp.dat.txt")
re.encoding = "utf-8"
with open("normtemp.dat.txt","w") as f:
f.write(re.text)
df = pd.read_csv("normtemp.dat.txt", header=None, sep="\s+")
df.columns = ['体温','性别','心率']
df.head()
# 2 不下载
columns = ['体温','性别','心率']
df = pd.read_csv("http://jse.amstat.org/datasets/normtemp.dat.txt", header=None, sep="\s+")
df.columns = ['体温','性别','心率']
01 人类体温均值真的是98.6F吗?
这个问题比较简单, 得到结果的方法也比较多. 以下两种都可以
df["体温"].mean()
df.describe()
结果说明, 体温的均值在98.25F.
02 体温样本数据是否服从正态分布?
首先看下数据的基本情况
df.head()
体温 | 性别 | 心率 | |
---|---|---|---|
0 | 96.3 | 1 | 70 |
1 | 96.7 | 1 | 71 |
2 | 96.9 | 1 | 74 |
3 | 97.0 | 1 | 80 |
4 | 97.1 | 1 | 73 |
现在以体温为主, 做以下分析,主要是做图,通过可视化的方法, 大致判断数据的整体情况. 包括