python数据分析之参数估计实践

最新推荐文章于 2024-06-17 06:34:17 发布

恋恋风尘hhh

最新推荐文章于 2024-06-17 06:34:17 发布

阅读量1.6k

点赞数 4

分类专栏： python数据分析文章标签：数据分析

本文链接：https://blog.csdn.net/weixin_42384784/article/details/105475980

版权

本文介绍了如何使用Python进行数据分析的参数估计，包括加载数据、点估计、中心极限定理及其验证、正态分布的特性验证以及区间估计和置信区间的概念。通过鸢尾花数据集，详细阐述了中心极限定理的应用，并展示了如何计算置信区间以估计总体参数。

摘要由CSDN通过智能技术生成

文章目录

1、加载相关库和数据集

使用的库主要有：pandas、numpy、sklearn、matplotlib、seaborn
使用的数据集：sklearn库中的鸢尾花数据集

import pandas as pd
import numpy as np
from sklearn.datasets import load_iris
import matplotlib.pyplot as plt
import seaborn as sns 
import warnings

plt.rcParams["font.family"] = "SimHei"          # 设置可以显示中文字体
plt.rcParams["axes.unicode_minus"] = False    
warnings.filterwarnings("ignore")             # 忽略警告信息

2、使用主要信息构造DataFrame

iris = load_iris()     # 加载鸢尾花数据集
# 拼接data信息和target信息，用于构造DataFrame
data = np.concatenate([iris.data,iris.target.reshape(-1,1)],axis=1)   
feature_names = iris.feature_names    # 特征名列，包含花萼和花瓣的长度和宽度
feature_names.append("target")        # 将"target"添加至特征名列表，作为拼接数据的列名
df = pd.DataFrame(data,columns=feature_names)