【第三课】kaggle案例分析三

Evernote Export

比赛题目介绍

  • TalkingData是中国最大的第三方移动数据平台,移动设备用户日常的选择和行为用户画像。目前,TalkingData正在寻求每天在中国活跃的5亿移动设备70%以上的行为数据,帮助客户更好的了解与其用户互动。
  • TalkingData提供了大约20万用户的数据(全部真实且经过脱敏处理),按照年龄和性别分成12个组,比如男性22到25岁,女性30到35岁,同时提供了用户行为属性,比如在什么样的时间点出现什么样的地理位置等等,选手通过这些信息去推测用户是分在哪一个性别年龄里面。
  • 什么是用户画像
  • 用户画像可以理解为就是为用户画标签,标签是不固定的,依照企业业务场景动态添加、删除等,有的标签是永久的,有的标签是可以动态变更的
  • 用户画像可以看做是综合性的标签系统,在自身拥有(或从第三方获得)的原始数据中,从多个维度对用户进行产品进行刻画,提取出商业价值潜力的语义信息,是常见的企业级大数据应用
  • 对于人常见标签与维度,地域、年龄、性别、文化、职业、收入、生活习惯、消费习惯等
  • 对于产品常见刻画维度,产品类别、活跃频率、产品喜好、产品驱动、使用习惯、产品消费等
  • 技术栈:无监督学习、半监督学习(技巧性很强),大多数是有监督学习
  • 用户画像的作用
  • 精准营销,分析产品潜在客户,针对特定群体利用短信邮件等方式进行营销
  • 用户统计,比如中国大学购买书籍人数TOP10,全国分城市指数等
  • 数据挖掘,构建智能推荐系统,利用关联规则计算,喜欢红酒的通常喜欢什么运动品牌,利用聚类算法分析,喜欢红酒的人的年龄段分布情况
  • 进行效果评估,完善产品运用,提升服务质量,其实这也就是相当于市场调研、用户调研,迅速下定位服务群体,提供高水平的服务
  • 对服务或产品进行私人定制,即个性化的服务某类群体甚至每一位用户(这是未来的消费趋势)比如,某公司退出一款5-10岁儿童的玩具,通过用户画像分析,发现某些特征的比重最大,就给产品提供了非常可观的决策依据
  • 业务经营分析以及竞争分析,影响企业发展战略
人工神经网络原理

  • 知识地图
  • 从单层感知器到多层感知器
  • 从多层感知器到自编码器
  • 从多层感知器到卷积神经网络,再到深度残差网络
  • 从多层感知器到递归神经网络,再到LSTM
  • 从单层感知器到Hopfield神经网络,再到Bolazmann机和RBM
  • 用RBM堆叠成DBN,DBN与多层自编码器结合成DBN-DNN
  • 神经网络要素
  • 网路结构(全连接、分层、有时滞回路、权值共享、激活函数)
  • 运行机制(异步更新、同步更新、前馈)
  • 训练算法,训练中使用的trick(mini batch BN drop out等),损失函数的定义
  • 训练数据(数据的预处理,输入和输出的构成等)
  • 单层感知器
  • 输入节点
  • 输出节点
  • 权向量
  • 偏置因子
  • 激活函数
  • 学习率
  • 单层感知器学习算法
  • 单层感知器的局限
    激活函数

sng(w1x1+w2x2+w3x3)=0

单层感知器类比于线性分类器

感知器学习的规则

1958年,首先定义了一个具有单层计算单元的神经网络结构,称为感知器
感知器的学习规则规定,学习信号等于神经元期望输出(教师信号)与实际输出之差

r=djoj

式中,dj为期望的输出,

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值