pandas
煲饭酱
数据进阶路上的煲饭酱,和他背着的用来讨饭的锅
展开
-
DataFrame按列的unique值划分源数据为unique个子数据DataFrame
dataframe按某一列的distinct值将源数据划分成多个子数据dataframe,并分别将子数据保存为csv# -*- coding: utf-8 -*-# @Author : Administrator# @DateTime : 2020/6/29 22:35# @FileName : subdata.py# @SoftWare : PyCharmimport numpy as npimport osimport pandas as pdfrom config.featu原创 2020-06-29 23:49:28 · 4726 阅读 · 0 评论 -
pandas基础属性方法随机整理(七):applymap, map, replace
pandas的DataFrame和Series分别有自己的矢量化函数pandas.DataFrame.applymap()pandas.Series.map()两个函数的params不同:map(self, arg, na_action=None):参数有三种类型选择 arg : function, dict, or Seriesx = pd.Series([1,2,3]...原创 2018-08-29 18:05:33 · 830 阅读 · 0 评论 -
pandas基础属性方法随机整理(四)---实例梳理(多知识点)
源数据格式: “” Yr Mo Dy RPT VAL ROS KIL SHA BIR DUB CLA MUL CLO BEL MAL 61 1 1 15.04 14.96 13.17 9.29 NaN 9.87 13.67 10.25 10.83 12.58 18.50 15.04 61 1 2 14.71 NaN 10...原创 2018-06-20 17:10:57 · 978 阅读 · 0 评论 -
pandas基础属性方法随机整理(三)--- 描述统计/去重计数/分组排序
分组和排序Series.value_counts() & drop_duplicates()数据集:baby_names.info()<class 'pandas.core.frame.DataFrame'>RangeIndex: 1016395 entries, 0 to 1016394Data columns (total 5 columns):N...原创 2018-06-20 11:20:35 · 8295 阅读 · 0 评论 -
pandas之dataframe移动复制删除列
pandas的DataFrame非常灵活,我们可以快速的移动、复制、删除列,今天就用案例来说明一下具体的工作是如何完成的。首先我们创建一个dataframe 打印一下: 增加列,我们可以把df当作一个object,给它增加一个属性c,如下: 这是增加c列以后的数据: 我们还可以插入一列数据到任意位置:比如插入到第二列 插入后的数据: 永久删除一列数据用del...转载 2018-06-19 17:28:16 · 10389 阅读 · 1 评论 -
pandas基础属性方法随机整理(二)--- 删除插入(drop 和 del ,pop() and insert())
DataFrame数据集删除功能: drop 和 del (del慎用)1) drop: (可选择性: 原址删除 / 视图删除),可多列df.drop(self, labels=None, axis=0, index=None, columns=None, level=None, inplace=False, errors=’raise’) (labels, axis=1 is ...原创 2018-06-19 16:50:47 · 4650 阅读 · 0 评论 -
pandas基础属性方法随机整理(一)--- index&column 重命名rename / Series--DataFrame
Series –> DataFrame: Series.to_frame()bigcolumn = pd.concat([series1, series2, series3], axis=0) # it is still a Series, so we need to transform it to a DataFrametype(bigcolumn)Out[66]: pan...原创 2018-06-19 15:37:52 · 12295 阅读 · 0 评论 -
pandas 合并数据集 pd.concat(), pd.merge(), ,data1.append(data2)
几种常用的合并数据集的方法: 1)pd.concat ([data1,data2,…], axis=1(or 0), keys=[‘key1’, ‘key2’,…], names=[‘upper’,’lower’,…], ignore_index=True/False,…) 2)pd.merge(left, right, how=’inner’, on=None, left_on=None, ...原创 2018-06-19 14:21:07 · 4148 阅读 · 0 评论 -
DataFrame改变列数据类型的--- Series/DataFrame. astype(...) //.infer_objects()
概述:DataFrame改变列数据类型的方法主要有2类:1) Series/df.astype('float64') “使用频率高” (DataFrame, Series都适用)2) Series/pf.infer_objects() : 将‘object’ 类型更改为‘float64/int...’类型(DataFrame, Series都适用)3) infer_objec...原创 2018-06-15 00:41:29 · 11187 阅读 · 0 评论 -
pandas基础属性方法随机整理(六)--- 缺失值处理
数据源:url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data'iris = pd.read_csv(url)iris.head()Out[50]: 5.1 3.3 1.4 0.2 Iris-setosa0 ...原创 2018-06-21 01:33:50 · 1453 阅读 · 0 评论 -
pandas之时间序列 / 缺失值 基础知识
Step 1. Import the necessary librariesIn [30]:import pandas as pdStep 2. Import the dataset from this address. Step 3. Assign it to a variable calledIn [31]:url = 'https://raw.githubusercon...转载 2018-06-21 00:53:28 · 5966 阅读 · 0 评论 -
pandas基础属性方法随机整理(五)---时间序列 resample方法
重采样及频率转换: resample方法: 各种频率转换工作的主力函数data.iloc[:,0:5].head()Out[218]: RPT VAL ROS KIL SHADATE 1961-01-01 15.04 14.96 13.17 ...原创 2018-06-20 21:35:08 · 6868 阅读 · 0 评论