自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 机器学习基础—集成学习Task6

结合自己数据完成关于混淆矩阵和ROC曲线绘制 def plot_confusion_matrix(cm, classes, title='Confusion matrix', cmap=plt.cm.Blues): plt.imshow(cm, interpolation='nearest', cmap=cmap) plt.title(title) plt.colorbar()

2021-03-29 23:06:41 103

原创 机器学习基础—集成学习Task5

终于到分类部分的内容了,此处主要展示自己的数据应用课程内容。 首先展示数据量,即不平衡数据的分类问题。 本次处理仅对训练集采用SMOTE过采样的方法。 def printing_Kfold_scores(X_train_data,Y_train_data): fold = KFold(5,shuffle=False) print(fold) c_param_range = [0.01,0.1] results_table = pd.DataFrame(index=range

2021-03-27 22:16:30 78

原创 2021-03-24

参数与超参数: 以网格搜索的方式寻找超参数GridSearchCV(),把所有的超参数选择列出来分别做排列组合。其目的是用于调整正则化的参数。 这里是个人数据处理部分内容,结合交叉验证寻找逻辑回归中最佳的参数c。 def printing_Kfold_scores(X_train_data,Y_train_data): fold = KFold(5,shuffle=False) print(fold) c_param_range = [0.01,0.1] results_t

2021-03-24 21:51:31 67

原创 机器学习基础—集成学习Task3

不做copy,因此一些个人理解和疑惑。请多指教。 1.关于过拟合task’3中做了很详细的解释,那么通俗一点的话,我们能否通过仅仅比较训练集打分和验证集打分的大小比较来简单地判断模型是否出现了过拟合的现象?对于模型评价的方法有很多,查准率、查全率、F1、ROC曲线等等,那么再分别比较训练集和验证集的相关指标时,是否也在间接判断模型是否过拟合?同时,能否选择一种简单的方法初步判断模型是否过拟合,以便后续讨论其他指标时不需再考虑过拟合问题。 2.方差和偏差的讨论部分能否理解为,例如在一个多元线性回归模型中,随着

2021-03-22 23:10:41 64

原创 机器学习基础—集成学习Task1

说明:首先感谢Datawhale,一个专注于AI领域的开源组织,一次偶然的机会接触到了Datawhale,在其交流群、论坛以及公开课中学习到了很多有关AI的内容,感谢本次公开课程集成学习(上)的组织者们,感谢生滚牛牛粥团队的各位成员,最后要特别感谢一下猪猪,猪猪的耐心指导解决了我很多困惑,爱您。作者本人目前研一,专业为环境科学与工程。本文意义不仅仅是课程学习的汇报,同时也是结合自身研究方向的成果展示,希望各位给予批评指正。 机器学习基础—集成学习Task1前言一、Datawhale案例展示及代码分析1.回

2021-03-15 23:17:16 244 1

原创 2020-12-19

第二章 pandas基础 由于本周处于期末复习和课程论文撰写阶段,故没有大量时间完成本次学习任务。仅结合自己的一些数据使用pandas实现配置环境和读文件过程。 # author: xuxt time:2020/12/19 import numpy as np import pandas as pd # 首先是引包。 df_csv = pd.read_csv('xxx.csv') print(df_csv) # 这里我引用了自己的数据集.csv文件(化合物描述符)。 df_txt = pd.read

2020-12-19 22:17:50 180 3

原创 Datawhale组队学习Pandas

第20期Pandas组队学习 目录第20期Pandas组队学习Task01 预备知识 Task01 预备知识 下面直接展示 内联代码片。(输出结果以 #备注 展示) # author: xuxt time:2020/12/14 L = [] def my_func(x): return 2*x for i in range(5): L.append(my_func(i)) print(L) # [0, 2, 4, 6, 8] 定义“我的函数”输入x,返回,2x,即输入1,2,3,4,5

2020-12-16 15:37:55 96

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除