数据分析学习
wert12581
这个作者很懒,什么都没留下…
展开
-
twitter_dog_rate数据清洗与简单分析(udacity)
import pandas as pdimport numpy as npimport requestsimport matplotlib.pyplot as pltimport reimport seaborn as sns%matplotlib inline数据收集#用pd.read_csv来读取twitter-archive-enhanced.csv内的信息并保存到twit...原创 2019-01-10 19:28:38 · 2110 阅读 · 0 评论 -
白葡萄酒质量分析
葡萄酒质量探索# 加载你最终使用的所有组件# 在这个代码块的分析中。# 注意,在这个代码块中,将参数 "echo" 设为假。# This prevents the code from displaying in the knitted HTML output.这可以避免代码混入 HTML 输出显示。# 应当在文件中,对所有代码块设为 echo=FALSE 。library(ggpl...原创 2019-01-14 20:39:51 · 6647 阅读 · 2 评论 -
评分卡建模初探之数据清洗部分
初衷其实现在评分卡已经深入到我们的生活之中了,在各种小微贷款的申请过程中都可以看到它的身影。对于存在于身边的事自然想要稍微深入了解一下。因此这几篇文章将会对于评分卡建立的整个流程进行一个简单梳理。由于本人是一个初学者,也不是业内人士,很有可能会出现错误,如果大佬发现了问题请指正。评分卡简介上图为一个典型评分卡的模型。对于每个变量进行分箱之后给与相应的得分,根据总分来判断放贷。评分卡一般分...原创 2019-01-21 15:00:31 · 2065 阅读 · 0 评论 -
评分卡建模初探之特征选取与建模环节
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsfrom cal import cal_woe_iv, feature_selection, vif_cal, replace_woefrom statsmodels.stats.outliers_influen...原创 2019-03-10 20:27:41 · 723 阅读 · 0 评论