- 博客(6)
- 资源 (1)
- 收藏
- 关注
原创 任务六-模型融合
Stacking模型融合概念:Stacking简单理解就是讲几个简单的模型,一般采用将它们进行K折交叉验证输出预测结果,然后将每个模型输出的预测结果合并为新的特征,并使用新的模型加以训练。参考链接如下:概念介绍目标Stacking融合,用你目前评分最高的模型作为基准模型,和其他模型进行stacking融合,得到最终模型及评分结果。代码实现# 构建 Stacking 模型,使用 svm ...
2019-03-18 13:53:14 355
原创 任务五-模型参数优化
模型参数优化各类模型优化结果逻辑回归模型clf = LogisticRegression(C=0.1, penalty='l1')model = clf.fit(X_train, y_train)# 参数说明。C表示逻辑回归模型中从参数C,分别取如下数组中的值,penalty同理,分别可以取l1和l2params = {'C': [0.01, 0.1, 0.5, 1], 'penalt...
2019-03-12 13:56:17 1814
原创 任务四-模型评估
模型评估指标说明accuracy、precision,recall和F1-score、auc值的指标定义如下accuracy(分类准确率)分类准确率分数是指所有分类正确的百分比。分类准确率这一衡量分类器的标准比较容易理解,但是它不能告诉你响应值的潜在分布,并且它也不能告诉你分类器犯错的类型。预测对的(包括原本是对预测为对,原本是错的预测为错两种情形)占整个的比例(越大越好,1为理想状态)...
2019-03-09 14:44:09 994
原创 任务三:使用svm模型,做信贷预测分类
前述在任务一和任务二中,分别对模型建立前的数据清理、归一化、特征值选取等做了学习。在本篇博客中,主要是通过svm算法,结合前两篇博客,实现对信贷数据分类预测的模型的简历。代码实现直接贴代码吧import pandas as pdimport numpy as npfrom sklearn.ensemble import RandomForestClassifierfrom skle...
2019-03-07 00:33:24 1767 1
原创 任务二:对数据特征进行挑选
目标分别用IV值和随机森林等进行特征选择……数据预处理在做特征筛选前,先对数据进行预处理,代码如下data = pd.read_csv("D://project//金融数据分析//data.csv", encoding='gbk')# 获取分类y = data['status']x = data.drop('status', axis=1)# 删除无用的列x.drop(['cus...
2019-03-05 02:44:31 645
原创 任务一:金融数据分类模型
任务一:金融数据分类模型综述数据获取数据预处理模型选择数据归一化模型建立总结未完待续......综述此为入门学习机器学习的第一篇博客,记录下…基于机器学习的数据分析模型的建立,主要分为以下几步:数据获取–>数据预处理–>模型选择–>数据归一化–>模型建立–>模型结果分析数据获取由学习小组提供了一份金融数据,就不贴在这里了数据预处理由于数据集中有好几十个维...
2019-03-02 18:52:17 2240
机器学习导论
2018-03-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人