初稿时间:2019年11月29日20点43分
更新时间:——
0.为什么要写这个案例篇?
最直接的原因是第一部分10个机器学习案例,来源于一篇文章中的一个机器学习系统设计的教程,刚开始看了一两个感觉和我们平时了解到接触到的内容差别挺大,据说是业界真实的应用,从最开始的目标、数据预处理到最后的部署到生产环境,这一系列的“真·实战经验”都是很难从一些教程里了解到的。
由此,我又按耐不住想去找一些数据分析相关的案例进行深入学习,一开始尝试从medium按照"data analyse","analyse"等关键词检索,最终收获不多(大概是上面提到的那篇教程质量太高了)
后来想起了看过的一篇文章于是顺腾摸瓜,筛选出了该系列的热度top10的文章
1.机器学习10 个经典案例
来源:一日千星的「机器学习系统设计指南」,这个英伟达小姐姐的项目火了
- 利用机器学习预测 Airbnb 上的房屋价值(medium)
- 利用机器学习提高 Netflix 上的数据流质量(medium)
- 缤客网 150 个成功的机器学习模型:从中学到的 6 个经验教训(个人博客)
- 从零到 400 万女性用户的时尚 APP——Chicisimo(medium)
- 用机器学习驱动 Airbnb 搜索体验(medium)
- Lyft 公司的反欺诈机器学习系统(medium)
- Instacart 外送服务中的路径优化(medium)
- Uber 的大数据平台:具有分钟级延迟的 100+Petabytes(medium)
- 利用计算机视觉和深度学习来创建现代化的 OCR 管道
- 利用 Uber 推出的 Michelangelo 机器学习平台来扩展机器学习
2.传统分析:
0. 《少年的你》之后,流量明星对电影意味着什么? (作者:罗钰靖、阿米)
这是我第一次关注到DT数说的文章,立马圈粉,文章质量相当高,以下是简单评论:
仅仅通过豆瓣数据就对流量明显和电影地关系进行了充分地探讨,出彩的地方似乎也没有,用到方法也就描述性统计、聚类分析、分词统计,但是确实是一篇利用数据探讨问题的好范文,对于关键问题都有充分地数据支持,逻辑也算合理。
以下是DT数说的热度top10(获取方式见:数据分析之公众号数据获取(小批量数据))
- ....
剩下的待我研究完后更新,敬请期待!
3.研究维度
1,拆解文章结构 :文章来源、数据来源、话题、作者、话题、分析方法
2.总结文章内容 + 一些实践
3.点评:创新性;特别点;迁移借鉴;