一、python训练营
raise关键字:抛出指定异常
try:
raise NameError('HiThere')
except NmaeError:
print('An exception flew by!')
二、数据挖掘
*分类指标评价计算示例
## accuracy
import numpy as np
from sklearn.metrics import accuracy_score
y_pred = [0, 1, 0, 1]
y_true = [0, 1, 1, 1]
print('ACC:',accuracy_score(y_true, y_pred))
y_pred:模拟预测结果
y_true:模拟实际结果
二者初次赋值无意义,仅是为了调用accuracy_score
一、XGBoost知识点补充
-
numpy:进行科学计算的基础软件包
pandas:开源数据分析和处理工具
matplotlib和seaborn绘图 -
数据集中NaN一般代表缺失值
-
可视化描述
箱型图:
小提琴图:小提琴图和箱线图类似,用来显示数据分布和概率密度,
这种图结合了箱线图和密度图的特征,用来显示数据的分布形状
-
XGBoost中的重要属性
weight:是以特征用到的次数来评价
gain:当利用特征做划分的时候的评价基尼指数
cover:利用一个覆盖样本的指标二阶导数平均值来划分
total_gain:总基尼指数
total_cover:总覆盖 -
热力图绘制
plt.figure(figsize=(8, 6))
sns.heatmap(confusion_matrix_result, annot=True, cmap='Blues')
plt.xlabel('Predicted labels')
plt.ylabel('True labels')
plt.show()