数据挖掘--统计学模块 04 数据分布-Python

1. 使用 Python 验证数据集中的体温是否符合正态分布。

http://jse.amstat.org/v4n2/datasets.shoemaker.html

   1 -  5  Body temperature (degrees Fahrenheit)
   9       Gender (1 = male, 2 = female)
  14 - 15  Heart rate (beats per minute)

根据数据,主要利用python 分析以下问题:

1. 人类体温均值真的是98.6F吗?
2. 体温样本数据是否服从正态分布?
3. 不正常的体温是多少?
4. 男性和女性的正常体温有明显的区别吗?
5. 体温和心率是否有相关性?

导入数据

首先导入数据,之后在此数据的基础上做各种分析

import requests
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
# 1 下载到本地
re = requests.get("http://jse.amstat.org/datasets/normtemp.dat.txt")
re.encoding = "utf-8"
with open("normtemp.dat.txt","w") as f:
    f.write(re.text)
df = pd.read_csv("normtemp.dat.txt", header=None, sep="\s+")
df.columns = ['体温','性别','心率']
df.head()
# 2 不下载
columns = ['体温','性别','心率']
df = pd.read_csv("http://jse.amstat.org/datasets/normtemp.dat.txt", header=None, sep="\s+")
df.columns = ['体温','性别','心率']

01 人类体温均值真的是98.6F吗?

这个问题比较简单, 得到结果的方法也比较多. 以下两种都可以

df["体温"].mean()
df.describe()

在这里插入图片描述
结果说明, 体温的均值在98.25F.

02 体温样本数据是否服从正态分布?

首先看下数据的基本情况

df.head()
体温 性别 心率
0 96.3 1 70
1 96.7 1 71
2 96.9 1 74
3 97.0 1 80
4 97.1 1 73

现在以体温为主, 做以下分析,主要是做图,通过可视化的方法, 大致判断数据的整体情况. 包括

  • 3
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python数据挖掘是一种从大型数据库中分析和发现预测信息的过程。它涉及使用Python编程语言和数据挖掘技术来处理和分析数据数据挖掘可以帮助我们从数据中提取有用的模式、趋势和关联,以便做出预测和决策。 学习使用Python进行数据挖掘可能会面临一些困难,特别是在早期阶段。您可能会遇到许多错误消息和挑战,但是通过坚持不懈地练习和应用到自己的数据集上,您可以逐渐掌握数据挖掘的技巧和方法。使用Python的数据挖掘工具和库,如Pandas,可以帮助您处理和分析数据,提供了一个简单的平台来组织、排序和操作数据。 要进行数据挖掘,您需要具备一定的统计学基础和编程知识。掌握Python编程语言和相关的数据挖掘技术,可以帮助您有效地处理大规模的数据,并从中提取有用的信息。 引用\[1\]和\[2\]提供了关于数据挖掘的一些背景和挑战,而引用\[3\]介绍了使用Python的Pandas模块来清理和重构数据的方法。这些资源可以帮助您更好地理解和应用Python数据挖掘技术。 #### 引用[.reference_title] - *1* *2* *3* [Python数据挖掘指南](https://blog.csdn.net/dmg17866/article/details/101377781)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v4^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值