自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 资源 (1)
  • 收藏
  • 关注

原创 任务六-模型融合

Stacking模型融合概念:Stacking简单理解就是讲几个简单的模型,一般采用将它们进行K折交叉验证输出预测结果,然后将每个模型输出的预测结果合并为新的特征,并使用新的模型加以训练。参考链接如下:概念介绍目标Stacking融合,用你目前评分最高的模型作为基准模型,和其他模型进行stacking融合,得到最终模型及评分结果。代码实现# 构建 Stacking 模型,使用 svm ...

2019-03-18 13:53:14 355

原创 任务五-模型参数优化

模型参数优化各类模型优化结果逻辑回归模型clf = LogisticRegression(C=0.1, penalty='l1')model = clf.fit(X_train, y_train)# 参数说明。C表示逻辑回归模型中从参数C,分别取如下数组中的值,penalty同理,分别可以取l1和l2params = {'C': [0.01, 0.1, 0.5, 1], 'penalt...

2019-03-12 13:56:17 1814

原创 任务四-模型评估

模型评估指标说明accuracy、precision,recall和F1-score、auc值的指标定义如下accuracy(分类准确率)分类准确率分数是指所有分类正确的百分比。分类准确率这一衡量分类器的标准比较容易理解,但是它不能告诉你响应值的潜在分布,并且它也不能告诉你分类器犯错的类型。预测对的(包括原本是对预测为对,原本是错的预测为错两种情形)占整个的比例(越大越好,1为理想状态)...

2019-03-09 14:44:09 994

原创 任务三:使用svm模型,做信贷预测分类

前述在任务一和任务二中,分别对模型建立前的数据清理、归一化、特征值选取等做了学习。在本篇博客中,主要是通过svm算法,结合前两篇博客,实现对信贷数据分类预测的模型的简历。代码实现直接贴代码吧import pandas as pdimport numpy as npfrom sklearn.ensemble import RandomForestClassifierfrom skle...

2019-03-07 00:33:24 1767 1

原创 任务二:对数据特征进行挑选

目标分别用IV值和随机森林等进行特征选择……数据预处理在做特征筛选前,先对数据进行预处理,代码如下data = pd.read_csv("D://project//金融数据分析//data.csv", encoding='gbk')# 获取分类y = data['status']x = data.drop('status', axis=1)# 删除无用的列x.drop(['cus...

2019-03-05 02:44:31 645

原创 任务一:金融数据分类模型

任务一:金融数据分类模型综述数据获取数据预处理模型选择数据归一化模型建立总结未完待续......综述此为入门学习机器学习的第一篇博客,记录下…基于机器学习的数据分析模型的建立,主要分为以下几步:数据获取–>数据预处理–>模型选择–>数据归一化–>模型建立–>模型结果分析数据获取由学习小组提供了一份金融数据,就不贴在这里了数据预处理由于数据集中有好几十个维...

2019-03-02 18:52:17 2240

机器学习导论

本书对机器学习的定义和应用实例进行了介绍,涵盖了监督学习、贝叶斯决策理论、参数方法、多元方法、维度归约、聚类、非参数方法、决策树、线性判别式、多层感知器、局部模型、隐马尔可夫模型、分类算法评估和比较、组合多学习器以及增强学习等。最新的第2版增加了三章内容,分别是核机器、图模型、贝叶斯估计,扩展了统计测试的内容,教学案例可以从本书配套网站下载。 机器学习的目标是对计算机编程,以便使用样本数据或以往的经验来解决给定的问题。机器学习已经有许多成功应用,包括分析以往销售数据来预测客户行为,优化机器人的行为以便使用最少的资源来完成任务,以及从生物信息数据中提取知识的各种系统。本书是关于机器学习这一主题内容全面的教科书,涵盖了通常在机器学习导论中并不包括的广泛题材。为了对机器学习问题和解进行统一的论述,本书讨论了源自不同领域的多种方法,包括统计学、模式识别、神经网络、人工智能、信号处理、控制和数据挖掘。书中对所有学习算法都进行了解释,以便读者可以轻易地将书中的公式转变为计算机程序。本书可用作高年级本科生或硕士研究生的教材,也可作为关注机器学习方法应用的专业

2018-03-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除