pandas入门-dataFrame
简介
Pandas是一款开放源码的BSD许可的Python库,为Python编程语言提供了高性能,易于使用的数据结构和数据分析工具。Pandas用于广泛的领域,包括金融,经济,统计,分析等学术和商业领域。
注:本页代码实现环境为jupyter
安装
pip install pandas
导入
# -*- encoding:utf-8 -*-
import os
import numpy as np
import pandas as pd
读取csv文件
path_dir = './datasets_src'
name_e = 'pandas_example.csv'
f_example = open(os.path.join(path_dir,name_e),'r',encoding='utf-8')
pd_example = pd.read_csv(f_example,encoding='utf-8')
print('表的列名:',pd_example.columns)
pd_example
创建、复制与新增列
new_dFrame = pd.DataFrame() # 创建新的dataFrame
new_dFrame = pd_example # 将之前的赋给新的dataFrame
sc_list = list([100,550,720,800])
new_dFrame['screen'] = sc_list # 新增列
new_dFrame # jupyter显示
取某列中某元素所在的行所组成的表
mnew_dFrame = new_dFrame[new_dFrame['computer'].isin([1000])] # 此处为取computer列中1000所在的行
mnew_dFrame
统计某列中个元素及数量
mnew_dFrame['mobile'].value_counts() # 默认升序排列
通过index重排数据表
mnew_dFrame_temp = mnew_dFrame.reindex([1,3,2])
mnew_dFrame_temp
将NaN值转化为0,方便之后使用pyecharts
mnew_dFrame_last = mnew_dFrame_temp.where(mnew_dFrame_temp.notnull(), 0)
mnew_dFrame_last
将某列全部置为某值
temp_ma['unit'] = temp_ma['unit'].map(lambda x:'某值')