python-pandas模块

最新推荐文章于 2023-09-20 10:56:42 发布

weekyin

最新推荐文章于 2023-09-20 10:56:42 发布

阅读量203

点赞数

分类专栏： python 文章标签： pandas python 数据分析

本文链接：https://blog.csdn.net/weekyin/article/details/128234601

版权

python 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

import pandas as pd
import numpy as np
import os
df = pd.DataFrame(columns=['A', 'B', 'C'], index=[0, 1, 2])
print(df)
'''
创建空的DataFrame
     A    B    C
0  NaN  NaN  NaN
1  NaN  NaN  NaN
2  NaN  NaN  NaN
'''
df = pd.DataFrame(data=[['Apple', 5],
                        ['Banana', 10],
                        ['cherry', 8],
                        ['Dates', 3],
                        ['Eggfruit', 7]],
                  columns=['Fruits', 'Quantity'],
                  index=[1, 2, 3, 4, 5])
print(df)
'''
手动创建DataFrame
Fruits  Quantity
1     Apple         5
2    Banana        10
3    cherry         8
4     Dates         3
5  Eggfruit         7
'''
fruits_list = ['Apple', 'Banana', 'Cherry', 'Dates', 'Eggfruits']
df = pd.DataFrame(fruits_list,
                  columns=['Fruits'],
                  index=['a', 'b', 'c', 'd', 'e'])
print(df)
'''
使用列表创建DataFrame
   Fruits
a      Apple
b     Banana
c     Cherry
d      Dates
e  Eggfruits
'''
fruits_dict = {'Fruits': ['Apple', 'Banana', 'Cherry', 'Dates', 'Eggfruit'],
               'Quantity': [5, 10, 8, 3, 7],
               'Color': ['Red', 'Yellow', 'Red', 'Brown', 'Yellow']}
df = pd.DataFrame(fruits_dict)
print(df)
'''
使用字典创建DataFrame
 Fruits  Quantity   Color
0     Apple         5     Red
1    Banana        10  Yellow
2    Cherry         8     Red
3     Dates         3   Brown
4  Eggfruit         7  Yellow
'''
df = pd.DataFrame([[1, 2], [2, 4]])
print('index:', df.index)   # 行标签
print('index name:', df.index.name)  # 行标签的名字
print('colums dtype:', df.columns.dtype)  # 列标签的数据类型
df = pd.DataFrame(data=np.arange(12).reshape(-1, 3), index=list('ABCD'), columns=['aa', 'ab', 'ac'])
print(df)
df.rename(columns={'aa': 'Aa'})  # 修改部分列名
print(df)
import pandas as pd                                                                                                    
import numpy as np                                                                                                     
import matplotlib.pyplot as plt                                                                                        
# 可以通过传递一个list对象来创建一个Series,pandas会默认创建整型索引                                                                            
s = pd.Series([1, 3, 5, np.nan, 6, 8])                                                                                 
print(s)                                                                                                               
'''                                                                                                                    
  0    1.0                                                                                                             
  1    3.0                                                                                                             
  2    5.0                                                                                                             
  3    NaN                                                                                                             
  4    6.0                                                                                                             
  5    8.0                                                                                                             
  dtype: float64                                                                                                       
'''                                                                                                                    
# 通过传递一个numpy array,时间索引以及列标签来创建一个DataFrame                                                                            
dates = pd.date_range('20130101', periods=6)                                                                           
print(dates)                                                                                                           
df = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=list('ABCD'))  # index:列标签 columns为行标签                   
print(df)                                                                                                              
name = ['计算机应用技术', '计算机网络技术', '软件技术', '云计算应用技术', '数字媒体技术', '大数据应用技术']                                                  
df = pd.DataFrame(np.random.randn(6, 6), index=name, columns=dates)                                                    
print(df)                                                                                                              
# 通过传递一个能够被转换成类似序列结构的字典对象来创建一个DataFrame                                                                                
df2 = pd.DataFrame({'A': 1,                                                                                            
                    'B': pd.Timestamp('20130102'),                                                                     
                    'C': pd.Series(1, index=list(range(4)), dtype='float32'),                                          
                    'D': np.array([3] * 4, dtype='int32'),                                                             
                    'E': pd.Categorical(["test", "train","test", "train"]),                                            
                    'F': 'foo'                                                                                         
                   })                                                                                                  
print(df2)