用户画像准确性评测初探 ——拨开python大数据分析的神秘面纱

最新推荐文章于 2024-09-17 11:22:18 发布

爱码小士

最新推荐文章于 2024-09-17 11:22:18 发布

阅读量865

点赞数

文章标签： Python 数据分析编程语言用户画像

本文链接：https://blog.csdn.net/Stephen_shijun/article/details/82866122

版权

本文探讨了用户画像准确性的评测方法，重点介绍了Python在数据处理和分析中的应用。通过问卷调查和数据分析，揭示了用户画像评测的关键步骤，包括问卷设计、数据处理、分析和优化。同时，强调了pandas库在数据处理中的重要作用，提供了pandas的安装、使用总结及常见操作示例。

摘要由CSDN通过智能技术生成

Part1 用户画像评测回顾与总结

1、为什么做用户画像评测？

将时钟拨回到2018年初，大家迫切想打破以往资讯推荐无章可循的局面，而今日的推荐算法也似乎演成了神话，用户意图这个词在WiFi管家团队被一再提及，继而AI推荐布局被推到了前台。

用户意图识别的优劣取决于对用户实时需求的了解程度，此事古来难。AI团队率先做的尝试是在一些特定场景下猜测用户意图，进行意图相关推荐，如住酒店用户，地铁上用户等，这是算法可以做的事情，那测试在这个过程中可以做些什么呢？算法验证相对滞后，有什么可以先行的呢？用户意图识别首要识别对用户场景，如果场景错了，后面的工作就无法关联起来。如，住酒店，是个动态场景，尝试进一步拆分成可衡量的静态场景，如，什么人（性别，工作，偏好等）？什么时间（出行时间）住什么酒店（酒店位置，级别等）？这些我们是有后套标签系统的，经过了解这些标签系统已经有些尝试应用，但是标签本身准确性却无从评估，因此，用户标签准确性评测就在懵懂中筹备开始了。

2、用户画像准确性怎么做？

感谢先行者浏览器团队，提供了最初的评测思路，他们的考虑很周全。而我在具体的实践过程中，根据业务的实际情况制定了最终的评测方案（下图），从第一轮标签提取开始，就暴露出各种细节问题，好在都一一解决了。