自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (1)
  • 收藏
  • 关注

原创 python数据挖掘与实战 第四章 数据预处理 数据离散化 代码纠错

在python数据挖掘与实战的第四章代码4-3的数据离散化中发现问题,纠正后代码如下:标注了改动1.2.3.4.5# -*- coding: utf-8 -*-# 数据规范化import pandas as pddatafile = r'D:\mechine learning\Data Analysis and Mining\chapter4\demo\data\discretization_data.xls' # 参数初始化data = pd.read_excel(datafile)

2021-06-03 17:40:00 403 1

原创 金融风控训练营赛题理解(task 6 贷款违约预测)学习笔记

本学习笔记为阿里云天池龙珠计划Docker训练营的学习内容,学习链接为:https://github.com/datawhalechina/team-learning-data-mining/tree/master/FinancialRiskControl一、学习知识概要决策树详解逻辑回归详解运用前段时间的学习知识进行比赛二、学习内容2.1 决策树详解主要学习ID3、C4.5、cart算法依据什么选取最优特征(构建结点):ID3看信息增益C4.5看信息增益率cart算法看gini

2021-05-05 23:19:14 257

原创 金融风控训练营赛题理解(task 5 模型融合)学习笔记

模型融合是一种有效提升机器学习效果的方法,通过构建并融合多个模型来完成学习任务。引用来源:https://www.jianshu.com/p/820f3ce58a60一、学习知识概要平均:简单平均法加权平均法投票:简单投票法加权投票法综合:排序融合log融合stacking:构建多层模型,并利用预测结果再拟合预测。blending:选取部分数据预测训练得到预测结果作为新特征,带入剩下的数据中预测。二、学习内容本篇文章大部分参考:htt.

2021-05-04 14:06:38 496 1

原创 金融风控训练营赛题理解(task 4 建模与调参)学习笔记

本学习笔记为阿里云天池龙珠计划Docker训练营的学习内容,学习链接为:https://github.com/datawhalechina/team-learning-data-mining/tree/master/FinancialRiskControl学习目标学习在金融分控领域常用的机器学习模型学习机器学习模型的建模过程与调参流程一、学习知识概要逻辑回归模型:理解逻辑回归模型;逻辑回归模型的应用;逻辑回归的优缺点;树模型:理解树模型;树模型的应用;树模型的优

2021-04-30 22:09:20 1499 1

原创 金融风控训练营赛题理解(task 3 特征工程)学习笔记

本学习笔记为阿里云天池龙珠计划Docker训练营的学习内容,学习链接为:https://github.com/datawhalechina/team-learning-data-mining/tree/master/FinancialRiskControl

2021-04-28 22:53:17 1547

原创 金融风控训练营赛题理解(task 2)学习笔记

金融风控训练营赛题理解(task 2)学习笔记本学习笔记为阿里云天池龙珠计划Docker训练营的学习内容,学习链接为:linkTask2目的:1.EDA价值主要在于熟悉了解整个数据集的基本情况(缺失值,异常值),对数据集进行验证是否可以进行接下来的机器学习或者深度学习建模.2.了解变量间的相互关系、变量与预测值之间的存在关系。3.为特征工程做准备1、学习知识概要学习如何对数据集整体概况进行分析,包括数据集的基本情况(缺失值,异常值)学习如何对数据进行统计规整,按条件进行筛选学习

2021-04-25 14:17:53 541

原创 金融风控训练营赛题理解(task 1)学习笔记

#金融风控训练营赛题理解(task 1)学习笔记赛题以金融风控中的个人信贷为背景,要求选手根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款,这是一个典型的分类问题##一、学习知识概要大纲形式说明知识点概要##二、学习内容自己觉得比较值得记录和巩固的知识点,对每一个知识点按自己的理解进行比较详细的介绍##学习问题与解答记录问题和解答##学习思考与总结...

2021-04-22 23:00:31 438 3

原创 配置hadoop文件时namenode节点报错Exception in thread “main“ java.lang.ExceptionInInitializerError

问题我使用的是VM16+CENTOS8+jdk15的版本去安装hadoop-2.7.1,再配置四个xml文件后,我在格式化namenode时出错,错误原因我当时忘记截图了,只知道Exception in thread “main” java.lang.ExceptionInInitializerError…解决方案:查询了很多,什么网络问题,配置文件都没错,最后降低了jdk版本为1.8的,问题直接解决hadoop-2.7.1最好还是配jdk1.8把。。。...

2021-03-24 20:13:11 587

时间序列整理知识.docx

依据《利用python进行数据分析》整理的一些知识

2021-04-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除