![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
暮雨潇潇_
这个作者很懒,什么都没留下…
展开
-
信用贷款违约预测项目
零、项目概述**项目背景:**比赛由 Kaggle 举办,要求选手依据客户的信用卡信息(application)、信用局信息(bureau)、历史申请信息(previous_application)分期付款信息(installments_payments)等7个主、副数据集来预测客户贷款是否会违约。分析流程:首先对数据进行预览和可视化探索,理解各个属性,查看数据集中的缺失值和异常值并进行相应地处理;其次对违约用户和非违约用户的属性分布进行可视化分析,探索差异点;接着通过用户属性可视化分析和业务理原创 2020-08-31 21:22:39 · 7900 阅读 · 2 评论 -
数据分析师面试必备(1)——SQL基础部分
SQL是数据分析师必备技能,本文详细地汇总整理了数据分析师面试的SQL全部重点。一、数据分析基础二、数据库与初识SQL三、数据管理工具及数据获取途径四、SQL非查询命令总结五、利用SQL查询数据行和列六、利用SQL数据预处理SQL的数据运算(算术运算、比较运算、逻辑运算、数学运算、字符串运算、聚合运算)八、控制函数(if、case)九、时间和日期函数十、数据分组(group by)与数据透视表十一、窗口函数十二、多表连接十三、子查询十四、SQL中的其他原创 2020-08-19 19:16:21 · 377 阅读 · 0 评论 -
入门NLP新闻文本分类Task2——数据读取与数据分析
数据加载#导入相关库import osimport pandas as pdimport matplotlib.pyplot as pltimport numpy as np#导入数据集os.chdir('D:/DLdata')#从数据集中随机抽取1%的数据df=pd.read_csv('D:/DLdata/train_set.csv/train_set.csv',sep='\t',skiprows=lambda x:x>0 and np.random.rand()>0.01)原创 2020-07-22 23:54:51 · 208 阅读 · 0 评论 -
Pandas数据分析基础总结(导图版)
微信公众号数据不吹牛号主开源了一本《用实战玩转Pandas数据分析》,本书分为两篇:基础篇和实战篇(资料可在其公号下载)。本文是基础篇的学习总结。原创 2020-07-14 22:07:43 · 344 阅读 · 0 评论 -
推荐!自学成才的数据科学家告诉要学习数据科学的10件事(附学习资源链接)
本文转载于微信公众号Datawhale,译文作者Datewhale,原文作者为Ken Jee,Ken Jee的研究方向为数据挖掘和生物医学,目前是一所大学的全职生物信息学副教授,通过自学数据科学家。转载链接 原文链接本文可以分为三大部分,第一部分为Ken对数据科学学习路线的介绍;第二部分为学习心态、学习方法及学习策略的分享;第三部分是Ken推荐的一些学习资料(附链接)。转载译文如下:我经常在我的YouTube频道DataProfessor上被问到以下有关如何进入数据科学领域的问题:如何转载 2020-06-27 20:15:06 · 1235 阅读 · 0 评论 -
入坑数据分析的几个问题——学习、面试、作报告
本文盘点了入坑数据分析的几个问题,主要涉及数据分析入门学习策略、面试数据分析岗位工具及业务的考察点、无实习经历如何准备面试以及面试时项目经历如何叙述等问题。一、问题概览二、问题解答问题1:数据分析入门学习1、入门学习最大的误区是求“大而全”,应该学习最少必要知识;2、入门数据分析的最少必要知识:统计学:描述性统计分析(平均值、四分位数、标准差、标准分)、推断性统计分析(参数估计、假设检验)Excel:使用频率最高的工具**SQL:**不必要学习很深,要会查询分析方法问题2:面试数据原创 2020-06-23 19:59:09 · 1318 阅读 · 0 评论 -
A公司某知识付费产品用户增长数据分析复盘
2020年4月-6月参加了乔布Up学院与GrowingIO合作的互联网数据分析实习生项目,这是本次实习对某知识付费产品案例的数据分析报告。原创 2020-06-08 12:29:00 · 254 阅读 · 0 评论