python
文章平均质量分 86
铖铖的花嫁
但愿日子干净,抬头遇见的都是柔情
展开
-
pandas在数据分析(异常值识别问题)中的应用,以衍生特征计算为例(含2022年全国服务外包大赛实例)
主要介绍pandas的应用,运用自然语言处理(NLP)的一些小知识和综合评价部分的知识,结合2022年全国大学生服务外包大赛A03赛题异常商品识别讲解,还有自己构建衍生特征的一些思路和想法。原创 2022-04-22 13:01:37 · 1462 阅读 · 0 评论 -
超全面 pandas 数据预处理+数据概览 处理技巧整理(持续更新版)
简单的说包括了分块读大文件和编码,遍历和速度计算、定位提取单个和多个连续不连续单元格/行/列,高阶函数,行列条件去重,判空条件去空,1/2维度转换,数据导出,nlp去标点算切词统计建词典,正则表达式提字符,增删改查行列单元格,合并行列,行列数据加减乘除乘方log,皮尔逊预先相似度应用,各种列关联运算,数据统计概览,数据排序,数据统计取值数量,画散点图饼图柱状图热力图等等,有很多细节在里面,调试了很多bug,考研当词典用原创 2023-03-10 05:00:00 · 1900 阅读 · 2 评论