- 博客(7)
- 收藏
- 关注
原创 “黑色星期五”数据分析实战
项目背景 美国圣诞节大采购一般是从感恩节之后开始的。感恩节是每年11月的第四个星期四。因此它的第二天,也就是美国人大采购的第一天。在这一天,美国的商场都会推出大量的打折和优惠活动,以在年底进行最后一次大规模的促销。这有点类似于淘宝的双十一购物节。项目中所使用的数据是零售商店中黑色星期五的约54万条交易样本数据,商店希望更加了解用户购买行为。所以本项目通过总结本次“黑五”销售状况,分析和研究不同用户对不同产品的购买行为来为下一次“黑五”提供相关参考。字段说明字段 含义 ...
2020-06-01 17:51:11 4559 1
原创 机器学习实战——基于逻辑回归的信用评分卡模型
项目背景: 信用评分模型是保障银行和其他金融部门而设立的一种关于人身金融权限的划定模型。它是指根据客户的各种属性和行为数据,利用一定的信用评分模型,对客户进行信用评分,据此决定是否给予授信以及授信的额度和利率,从而识别和减少在金融交易中存在的交易风险。该模型将风险标准化,分数的存在使得审批者有了最简单易用的判断标准;整体的信贷资产质量也有了量化指标。常用的信用评分卡有A卡,B卡,C卡具体如下:A卡(Application scorecard),申请评分卡。用于贷款审批前期对借款申...
2020-05-25 15:46:16 7743 20
原创 kaggle 共享单车项目数据分析和单车租赁数预测
项目背景 自行车共享系统是租用自行车的一种方式,在这里,通过遍布城市的信息亭网络,可以自动获得会员资格、租赁和自行车归还。使用这些系统,人们可以从一个地方租一辆自行车,并根据需要将其送回另一个地方。目前,全世界有超过500个自行车共享项目。 这些系统产生的数据使它们对研究人员具有吸引力,因为旅行的持续时间、出发地点、到达地点和经过的时间都有明确的记录。因此,自行车共享系统起到了传感器网络的作用,可以用来研究城市中的移动性。本项目通过结合历史使用模式和天气数...
2020-05-11 01:23:06 10855 9
原创 机器学习项目实战——信用卡反欺诈预测模型
项目背景: 该项目所使用的数据集包含欧洲持卡人在两天内使用信用卡进行交易的数据,共有284807笔交易,其中有492笔交易为盗刷。数据集中的数据是经过了PCA降维后的数据,并且出于保密原因,这些特征都进行了脱敏处理。通过对这些数据的分析,建模,可以对信用卡盗刷情况进行预测。有利于银行对存在风险的交易进行制止,减小银行和持卡人的损失。数据总览: 从数据来看,类别分为:1...
2020-05-08 13:25:15 2571 1
原创 机器学习笔记——逻辑回归模型(概念篇)
逻辑回归(Logistic Regression, LR),逻辑回归虽然带有‘回归’二字,但是逻辑回归却属于分类算法。逻辑回归可以进行多分类操作,但由逻辑回归算法本身性质决定其更常用于二分类。 关于逻辑回归,可以用一句话来总结:逻辑回归假设数据服从伯努利分布,通过极大似然函数的方法,运用梯度下降或牛顿法来求解参数,来达到将数据二分类的目的。(后续的博文会陆续介绍里面所蕴含...
2019-10-12 01:07:32 507
原创 鸟哥Linux学习笔记———文件属性
当使用root身份登录后,使用ls -al命令时会出现如下内容:[root@localhost ~]# ls -altotal 24492drwxr-x--- 16 root root 4096 Nov 10 06:18 .drwxr-xr-x 28 root root 4096 Nov 10 05:51 ..drwxr-xr-x 2 root root 4...
2018-11-10 23:37:09 104
原创 鸟哥Linux学习笔记———用户与用户组
文件所有者:Linux是一个多用户多任务的系统,通常会有多个用户同时在主机上工作,为了考虑每个用户的隐私,以及喜好的工作环境,这时候就需要文件所有者就会扮演重要的角色。文件所有者相当于文件的主人,我们可以通过设置适当的权限让他人无法看到里面的内容,或者仅限于组内用户。用户组:当我们与别人在同一台主机上合作完成一个任务时,我们可以建立一个用户组,在这个用户组上,通过设置相应的权限,我们每个人所做...
2018-11-10 00:06:04 138
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人