自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 关于利用Tushare构建自己的股票数据库

关于利用Tushare构建自己的股票数据库1.安装MongoDB数据库2.抓取股票行情数据3.抓取股票基本数据安装MongoDB数据库MongoDB作为一个非关系型数据库,储存我们的股票数据是非常合适的,因为很对时候我们的数据都是键值对的形式,同时格式并不完全一致。可以去MongoDB官网去下载下载网址,安装完成后可以下载一个可视化的操作软件叫MongoDBCompass,我们能够像navicat那样对数据进行操作。...

2020-11-27 00:50:33 1539 1

原创 招商银行fintech评分卡案例

这里写目录标题数据简介数据预处理变量筛选相关性分析三级目录数据简介此次分享的数据案例是我的同学参加的2020年招商银行fintech项目时碰到的案例,我就正好拿这个案例来进行了一下评分卡的建模练习,首先此次数据主要包括三个数据集,分别是行为数据、标签数据、交易数据。训练集和测试集都已经分好,最终的目的如下所示。数据预处理import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn a

2020-07-01 18:00:05 1413 3

原创 adaboost算法原理及实现

模型概述Adaboost模型属于boost模型中的一种,boost模型的思想是通过从弱学习算法出发,反复学习,得到一系列弱分类器(又称为基本分类器),然后组合这些弱分类器,得到相应的强分类器。大多数的boost方法都是改变训练数据的概率分布,然后针对不同的训练数据分布学习相应的弱分类器。Adaboost的模型的思想是在每一次训练过程中提高被前一轮弱分类器的错误分类的样本的权重,这样可以让分类器更好的纠正错误。在训练完所有的分类器后,Adaboost采用的是加权多数表决的方法来进行投票,加大分类误差率小的

2020-06-29 23:06:31 253

原创 感知机模型原理及实现

模型概述感知机是分类模型中最经典和简单的一种模型,根据《统计学习方法》中的定义:假设输入空间(特征空间)是 χ⊆Rn\chi\subseteq\R^{n}χ⊆Rn,输出空间是φ={+1,−1}\varphi={ \lbrace {+1, -1}} \rbraceφ={+1,−1}。输入x∈χx\in\chix∈χ表示实例的特征向量,对映输入空间(特征空间)的点;输出y∈φy\in\varphiy∈φ表示实例的类别。由输入空间到输出空间的如下函数:f(x)=sign(w⋅x+b)f(x) = sign(

2020-06-28 20:52:25 884

原创 kaggle 电商数据分析

kaggle电商零售数据分析案例项目背景数据清洗退货情况分析客户RFM分析项目背景这个数据集是kaggle上面的一个电商数据集,其中包含2010年12月12日至2011年12月9日之间在英国注册的非商店在线零售的所有交易。该公司主要销售各种独特的礼品之类,其中许多客户该公司是批发商。因此本次数据分析将对客户进行分析,并对客户进行相关分层处理。数据清洗import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimpor

2020-06-17 17:01:46 5506 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除