pandas
weixin_41734687
这个作者很懒,什么都没留下…
展开
-
用户画像-ID_MAPPING 利用并查集——求无向图的所有连通子图来实现所有用户合并
一 项目背景本项目是基于https://blog.csdn.net/weixin_41734687/article/details/99174064 此项目的改进。去年利用jacaard相似度对多用户进行了合并。由于受到计算资源的制约,在对多用户进行合并时,只选取了有限量元素进行合并,导致一些用户没有合并为一个用户,在实际数据运用中,会出现部分数据one_id会发生变化,对用户画像分析造成了困...原创 2020-03-25 00:10:04 · 1051 阅读 · 0 评论 -
python pandas 将excell转为csv 处理数据日期 替换数据内换行换行 代码亲测可用
pandas 将excell转为csv,并且替换掉excell里面的换行符,处理完日期业务需求:公司从外部获取了一份excell文件,需要把文件放到hive里面,excell里面有不符合要求的日期格式,并且字段里面包含换行符,hive识别后,会造成字段串位,所以需要把excell的日期和换行符处理完成之后,转成csv,然后推到集群将excell转成csv def exce...原创 2018-09-05 23:41:39 · 2689 阅读 · 0 评论