【汇总篇】数据分析、机器学习、数据挖掘相关实例的补充说明

数据可视化

离散型变量(性别、职业等):饼图、柱状图(一个离散型变量)、堆积柱状图(两个离散型变量)
连续型变量(年龄、工资等):直方图、箱线图
时间序列变量(GDP、CPI等):折线图

数据类型
横截面数据:某个时间节点上,多个对象的数据
时间序列数据:一些时间节点上,某个对象的变化数据
面板数据:多个时间节点,对同一批对象的数据

研究不同性别的年龄构成:箱线图

回归分析

  • 回归五式:
    线性回归(Y为连续型数据)股票投资、客户终身价值、医疗健康
    0-1回归(Y为0-1型数据,逻辑回归、Probit Re‐gression)互联网征信、个性化推荐、社交好友推荐
    定序回归(Y 为定序数据)消费者偏好市场调研(李克特1~5点量表)、豆瓣评级(1~5分)、心理测试
    计数回归(Y为计数数据)客户关系管理RFM模型、肿瘤个数、生几个孩子
    生存回归(Y 为生存数据)寿险精算、电子产品寿命、消费者生命周期

  • 案例
    线性回归
    北京市二手房房价
    中国电影票房
    线上女装销量预测
    股票投资中的均线
    0-1回归
    某移动通信公司客户流失预警分析
    车险数据分析与商业价值
    点击率预测在R T B广告投放中的应用
    定序回归
    信用卡逾期数据分析
    计数回归
    英超进球谁最强
    生存回归
    新产品在架时长研究

机器学习

朴素贝叶斯
12345,有事找政府

决策树
非诚勿扰

回归树与提升算法
二手车保值率

深度学习
图像自动识别
打麻将

K均值聚类
狗熊皮鞋的百度广告投放

非结构化数据

中文文本
小说的三要素:以《琅琊榜》为例
从用户评论看产品改善
空气净化器的好评率影响因素分析
数据分析岗位招聘情况的影响因素分析
张无忌爱谁

网络结构数据
《甄嬛站》

图像数据
通关图片识别PM2.5

刷卡数据
互联网征信

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值