【第三课】kaggle案例分析三

最新推荐文章于 2024-08-18 09:00:00 发布

weixin_30659829

最新推荐文章于 2024-08-18 09:00:00 发布

阅读量8.2k

点赞数

文章标签：人工智能 python 大数据

原文链接：http://www.cnblogs.com/pandaboy1123/p/10394562.html

版权

Evernote Export

比赛题目介绍

TalkingData是中国最大的第三方移动数据平台，移动设备用户日常的选择和行为用户画像。目前，TalkingData正在寻求每天在中国活跃的5亿移动设备70%以上的行为数据，帮助客户更好的了解与其用户互动。
TalkingData提供了大约20万用户的数据(全部真实且经过脱敏处理)，按照年龄和性别分成12个组，比如男性22到25岁，女性30到35岁，同时提供了用户行为属性，比如在什么样的时间点出现什么样的地理位置等等，选手通过这些信息去推测用户是分在哪一个性别年龄里面。
什么是用户画像
用户画像可以理解为就是为用户画标签，标签是不固定的，依照企业业务场景动态添加、删除等，有的标签是永久的，有的标签是可以动态变更的
用户画像可以看做是综合性的标签系统，在自身拥有(或从第三方获得)的原始数据中，从多个维度对用户进行产品进行刻画，提取出商业价值潜力的语义信息，是常见的企业级大数据应用
对于人常见标签与维度，地域、年龄、性别、文化、职业、收入、生活习惯、消费习惯等
对于产品常见刻画维度，产品类别、活跃频率、产品喜好、产品驱动、使用习惯、产品消费等
技术栈：无监督学习、半监督学习(技巧性很强)，大多数是有监督学习
用户画像的作用
精准营销，分析产品潜在客户，针对特定群体利用短信邮件等方式进行营销
用户统计，比如中国大学购买书籍人数TOP10，全国分城市指数等
数据挖掘，构建智能推荐系统，利用关联规则计算，喜欢红酒的通常喜欢什么运动品牌，利用聚类算法分析，喜欢红酒的人的年龄段分布情况
进行效果评估，完善产品运用，提升服务质量，其实这也就是相当于市场调研、用户调研，迅速下定位服务群体，提供高水平的服务
对服务或产品进行私人定制，即个性化的服务某类群体甚至每一位用户(这是未来的消费趋势)比如，某公司退出一款5-10岁儿童的玩具，通过用户画像分析，发现某些特征的比重最大，就给产品提供了非常可观的决策依据
业务经营分析以及竞争分析，影响企业发展战略

人工神经网络原理

知识地图
从单层感知器到多层感知器
从多层感知器到自编码器
从多层感知器到卷积神经网络，再到深度残差网络
从多层感知器到递归神经网络，再到LSTM
从单层感知器到Hopfield神经网络，再到Bolazmann机和RBM
用RBM堆叠成DBN，DBN与多层自编码器结合成DBN-DNN
神经网络要素
网路结构(全连接、分层、有时滞回路、权值共享、激活函数)
运行机制(异步更新、同步更新、前馈)
训练算法，训练中使用的trick(mini batch BN drop out等)，损失函数的定义
训练数据(数据的预处理，输入和输出的构成等)
单层感知器
输入节点
输出节点
权向量
偏置因子
激活函数
学习率
单层感知器学习算法
单层感知器的局限
激活函数

sng(w1x1+w2x2+w3x3)=0

单层感知器类比于线性分类器

感知器学习的规则

1958年，首先定义了一个具有单层计算单元的神经网络结构，称为感知器
感知器的学习规则规定，学习信号等于神经元期望输出(教师信号)与实际输出之差

r=dj−oj

式中，dj为期望的输出，

最低0.47元/天解锁文章

weixin_30659829

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。