一、数据源
1、读取数据
import pandas
JL_data=pandas.read_excel(io='路径\数据源.xlsx')
data=pandas.DataFrame(JL_data)
import pandas as pd
merged_data= pd.read_csv(r'路径\数据源.csv')
一个文件夹内的文件合并后读取
import os
import pandas as pd
folder_path = r'C:\...'
# 获取文件夹中的所有CSV文件
csv_files = [file for file in os.listdir(folder_path) if file.endswith('.csv')]
# 创建一个空的DataFrame用于存储合并后的数据
merged_data = pd.DataFrame()
# 遍历每个CSV文件并合并数据
for file in csv_files:
file_path = os.path.join(folder_path, file)
data = pd.read_csv(file_path)
merged_data = pd.concat([merged_data, data], ignore_index=True)
2、编写数据
1)行列
data=pd.DataFrame(
np.random.randint(low=0,high=6,size=(5,5)),
columns=['列1','列2'],
index=['行1','行2'])
2)列
data=pd.DataFrame({'key1':list('aabba'),
'key2': ['one','two','one','two','one'],
'data1': np.random.randn(5),
'data2': np.random.randn(5)})
二、数据获取
1、单列:data["lng"]
2、多列:
xl = data.iloc[:, 1:] # 选取DataFrame的所有行,并截取第二列至最末列。
df = data.iloc[1:] # 选取DataFrame的第二行至最末行,保留所有列,并将选取的数据表保存在一个新的变量中。
3、单个值:
data["lng"][0]==data.loc[0,