
数据分析
hepan_defeng
农村男孩子一枚
展开
-
生鲜电商行业以及APP体验分析
原创 2020-07-06 20:22:51 · 416 阅读 · 0 评论 -
基于集成算法GBDT和RandomForest的投票组合模型的异常检测----python数据分析与数据运营
本文基于python数据分析与数据化运营-第六章学习笔记,数据与大部分代码均来源数据该书;棘突某企业的订单数据(含异常订单),建立分类模型,实现异常订单检测案例数据:13*134190,有异常值和缺失值;字段:order_id,order_date,order_time,商品类别,商品渠道,pro_id,pro_brand,total_money,total_quantity,order_source,pay_type,use_id,city,目标变量import numpy as npimp原创 2020-05-19 15:08:09 · 762 阅读 · 0 评论 -
基于SPSS的中国消费者信心指数影响因素分析-----相关性分析
说明:本案例基于spss数据分析与挖掘实战案例精粹----第10章案例背景:对受访者的背景资料对消费者信心指数的影响加以研究,并进一步考察其内部的详细作用方式;分析方法:使用方差分析对自变量进行筛选,然后建议多元回归方差,进一步考察变量的影响,在此基础上,有利用最优尺度回归深入探讨自变量可能的各种复杂作用趋势,并利用多水平模型深入分析了信心指数变异在时间水平上的情况;消费信心指数计算主要变量:1、与一年前相比,您的家庭现在的经济状况怎么样?2、与现在相比,一年后您的家庭经济状况将会如何变原创 2020-05-19 21:33:34 · 11178 阅读 · 1 评论 -
利用SPSS实现逻辑回归,树模型,以及广义线性模型
本案例是IBM SPSS数据分析与挖掘实战案例精粹----第九章的学习记录案例背景:分析出导致急救后迟发性颅脑损伤的主要影响因素,共有201项案例:分析思路:先使用logistic回归模型进行影响因素筛选,然后利用分类树探索自变量中是否存在交互作用,最后利用广义线性模型过程拟合带交互项的Logistic回归模型字段:性别,年龄,收缩压,舒张压,血小板,脑挫伤,中线位移,脑肿胀,入院意识,是否手术急救,其余急救措施,是否出现迟发性脑损伤;...原创 2020-05-14 21:55:10 · 17976 阅读 · 2 评论 -
基于Gradient Booting的自动化超参数优化的销售预测----python数据分析与数据运营
本文基于python数据分析与数据化运营-第六章学习笔记,数据与大部分代码均来源数据该书;案例背景针对某单品的订单量预测应用数据介绍:731*10数据,有缺失及异常值,字段包括,是否有限购,促销活动类型,促销活动重要性,产品重要性分级,促销资源位数量,电子邮件中包含该商品的比例,单品价格,折扣率,促销活动展示的小时数,单品促销费用,销售数量;import numpy as npimport pandas as pdfrom sklearn.ensemble import GradientBo原创 2020-05-13 11:47:56 · 385 阅读 · 0 评论 -
营销响应预测分析----python数据分析与数据化运营
本文基于python数据分析与数据化运营-第五章学习笔记,数据与大部分代码均来源数据该书;案例背景:会员部门在做会员营销时,希望能通过数据预测在下一次营销活动时,响应活动会员的具体名单和响应概率,以此制定针对性的营销策略案例数据介绍:特征变量数113;变量包含:age,total_pageviews,edu_ages,edu,user_level,industry,value_level,act_level,sex,blue_money,red_money,work_hours,region,lab原创 2020-05-11 14:29:37 · 964 阅读 · 0 评论 -
spss实战案例----分析多个变量与因变量之间是否存在关系,方差分析
案例背景或目标:激素水平是否在对照组和实验组之间存在差异分析方法:Bootstrap抽样,秩和检验,秩变换方法,cox回归字段包括:性别,年龄,萎缩程度,胃粘膜细胞肠化生程度基本思路:控制变量法,首先排除性别,年龄,萎缩程度,胃粘膜细胞肠化生程度的影响;探索性数据分析:观察样本量,样本的分布,是否存在偏态分不等;...原创 2020-05-10 21:03:50 · 26792 阅读 · 0 评论 -
python数据分析与数据运营---第五章RFM实战案例
5.7案例:基于RFM的精细化用户管理案例背景:在用户2015-2018年订单数据的基础上,对用户进行分群,总结每个组用户特征,以便于精细化运营,制定定制化和差异性的营销和关怀;分析思路:基于RFM对用户进行分群,将三个维度分别作三个区间的离散化...原创 2020-05-08 13:49:50 · 768 阅读 · 0 评论 -
第六章-酸奶饮料新产品口味测试研究案例
项目背景:在问卷调研的基础上,分析两种新口味酸奶饮料口味情况;分析思路:主要通过均数比较的方式,评价口味的差别,因此使用方差分析;数据分析:1.通过:分析--描述--交叉表 查看样本的分布情况;总的来看每个城市的样本量都大于30,符合普通方差分析模型的要求方差分析模型应用时对样本的要求如下:(1)独立性:各样本必须是相互独立的随机样本,样本含量尽可能相等或相差不大;(2...原创 2020-05-06 20:23:21 · 2842 阅读 · 0 评论 -
SPSS实战案例--第四章
项目目标:在对客户喜好调研的基础上,搭建购物网站。主要调研问题:性别,年龄,教育程度,购买习惯,购买产品倾向,是否有网络购物经历,网购月消费金额,支付方式;多选题的数据转换:多选题输入时,一般以二分法进行输入,可以定义“多重响应集”,对数据进行处理,以便于进行统计分析数据处理:1.处理重复值:1)先标记重复值---->数据--标记重复个案;2删除重复值----->数...原创 2020-05-05 20:07:14 · 1141 阅读 · 0 评论 -
构建信用卡反欺诈预测模型——机器学习
本项目需解决的问题本项目通过利用信用卡的历史交易数据,进行机器学习,构建信用卡反欺诈预测模型,提前发现客户信用卡被盗刷的事件。建模思路项目背景数据集包含由欧洲持卡人于2013年9月使用信用卡进行交的数据。此数据集显示两天内发生的交易,其中284,807笔交易中有492笔被盗刷。数据集非常不平衡,积极的类(被盗刷)占所有交易的0.172%。它只包含作为PCA转换结果的数字输入变量。不幸的是,由于保密...原创 2018-04-18 09:08:46 · 16426 阅读 · 5 评论 -
贷款数据探索风险分析(EDA)
项目介绍所谓探索性数据分析(Exploratory Data Analysis,以下简称EDA),是指对已有的数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。特别是当我们对这些数据中的信息没有足够的经验,不知道该用何种传统统计方法进行分析时,探索性数据分析就会非常有效。探索性数据分析在上世纪六十年...原创 2018-04-18 09:10:38 · 6745 阅读 · 1 评论 -
泰坦尼克生存概率预测
(https://github.com/hpchihuo/titanic)项目背景:本项目从数据分析的角度,寻找与生存率项目相关的生存因素,建立逻辑回归模型预测tantic人员生存情况。1.提出问题:找出最优模型来预测titanic乘客生存结果项目概况:Titanic号的沉没是历史上最惨痛的沉船事故之一。在1912年4月15号,Titanic首次航行便因撞击冰山而沉没。在2224名乘客和船员中,有...原创 2018-04-10 14:34:36 · 2479 阅读 · 0 评论