pandas中获取每行最后一个非空元素
公司有一个问答产品,业务需要分析用户的主要跳出问题,而我得到的数据是一张含有每道题的问题和回答的excel表格,用pandas读取如下图所示。
![原始数据](https://i-blog.csdnimg.cn/blog_migrate/20c96a42ecc2ad8934445d305a8e738b.png)
可以看到针对每个人会有150个问题,和150个答案,但是大多数人都没有完成所有问题就跳出了,没有回答的问题在数据中就会显示NaN,现在需要统计每个人的跳出问题,也就是每个人回答问题的最后一个非空元素。
第一步:取出所有问题
原始数据的columns是非常规范的,我们先把所有问题拿出单独放在一个df里处理
questions = origin[['问题'+str(i) for i in ran