![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Pandas
哎呦哥哥、
这个作者很懒,什么都没留下…
展开
-
Pandas(九)——时序数据
介绍四类时间变量:名称描述元素类型创建方式Date times(时间点/时刻)描述特定日期或时间点Timestampto_datetime或date_rangeTime spans(时间段/时期)由时间点定义的一段时期PeriodPeriod或period_rangeDate offsets(相对时间差)一段时间的相对大小(与夏/冬令时无关)DateOffsetDateOffsetTime deltas(绝对时间差)一段时间的绝对大小(与夏/冬原创 2020-06-29 14:22:22 · 355 阅读 · 1 评论 -
Pandas(八)——分类数据
原创 2020-06-28 09:29:20 · 132 阅读 · 0 评论 -
Pandas(七)——文本数据(Textual Data)
前言文本数据指不能参与算术运算的任何字符,也称为字符型数据。如英文字母、汉字、不作为数值使用的数字(以单引号开头)和其他可输入的字符。文本数据的特点半结构化文本数据既不是完全无结构的也不是完全结构化的。例如文本可能包含结构字段,如标题、作者、出版日期、长度、分类等,也可能包含大量的非结构化的数据,如摘要和内容。高维文本向量的维数一般都可以高达上万维,一般的数据挖掘、数据检索的方法由于计算量过大或代价高昂而不具有可行性。高数据量一般的文本库中都会存在最少数千个文本样本,对这些文本进行预处原创 2020-06-26 15:36:34 · 2372 阅读 · 0 评论 -
Pandas(六)——缺失数据(Missing Data)
Pandas——缺失数据(Missing Data)思维导图基本概念缺失值的分类数据值的处理方法缺失观测及其类型缺失数据的运算与分组填充与剔除插值(interpolation)思维导图基本概念缺失值的分类按照数据缺失机制可分为:可忽略的缺失完全随机缺失(missing completely at random, MCAR)所缺失的数据发生的概率既与已观察到的数据无关,也与未观察到的数据无关.随机缺失(missing at random, MAR)假设缺失数据发生的概率与所观察原创 2020-06-23 16:32:17 · 3854 阅读 · 0 评论