数据集的概况:
1. 性别:保险承包商性别,女性,男性
2. bmi:身体质量指数,提供对身体的理解,相对于身高相对较高或较低的重量,使用身高与体重之比的体重客观指数(kg /平方公尺),理想情况下为18.5至24.9
3. 儿童:健康保险覆盖的儿童人数/家属人数
4. 吸烟者:吸烟
5. 地区:受益人在美国,东北,东南,西南,西北的住宅区。
6. 费用:由健康保险计费的个人医疗费用
#导入需要的库
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.preprocessing import LabelEncoder
from sklearn.preprocessing import OneHotEncoder