使用PyQt5从零进行大数据app构建(五)使用用户画像和随机森林模型进行预测

本文介绍了使用PyQt5构建大数据应用的过程,重点关注如何将纵表转为横表的用户画像,并利用随机森林模型进行预测。在数据处理中,涉及了pandas技巧和数据预处理,包括标签数据转换为数值类型,以及通过历史数据建立映射表进行模型输入。同时,指出了目前实现存在的健壮性问题,如映射表外的类型和错误输入导致的问题。
摘要由CSDN通过智能技术生成

前言:想写一个应用好久了,独立开发大概是每个程序员的梦想。自从之前写了一个数据挖掘的小模型,一直想封装一下,故而上路,所以此系列算不上教程,只是记录分享这个过程的坑点和经验,力求有头有尾,网上抄来抄去的教程真的看的头疼,己所不欲勿施于人,在封装完毕之后我会将完整的代码贴出来与大家分享。

教程合集地址:https://blog.csdn.net/infent/column/info/30927

第五篇 纵表转横表的用户画像,和随机森林模型预测。

原始数据我们已经在MySQL里存好了,总共有114万多条数据,但是这是基于事件的数据,我们想把它转换成基于车牌号的用户数据,具体的用户画像模型构建我会在单独总结,这里我们主要说明和应用封装有关的东西,所以数据处理部分就直接粘贴代码了。

计算完横表我们就可以把它存入数据库了,用来在计算时调用,这部分不太涉及到算法,主要是pandas处理技巧,接下来我们将对页面获取的数据进行数据预处理和随机森林模型调用。

因为选用的模型,要求计算概率,所以输入的必须是浮点型数据,第一步,我们需要将获取到的用户输入的标签类型数据,转换为数值类型。我们在主界面中已经设置好槽函数了,上图展示的就是querybyid的结果,接下来我们要接到用户输入

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值