一. # read_csv与read_excel的差异性
一个pandas学习的小小记录
pandas读取excel文件代码
savapath = r"C:\Users\test.xlsx"
df = pd.read_excel(savapath,names=None,usecols=[1])
#usecols=[1]代表读取excel的第一列
#usecols=[1,3]代表读取excel的第一列和第三列
data = df.values
for i in range(0,len(data)):
print(data[i][0])
pandas读取csv文件代码
savapath = r"C:\Users\test.csv"
data = pd.read_excel(savapath,sep=',',header=None,encoding='gbk')
for i in range(0,len(data)):
print(data[0][i])
- pandas读取excel文件时如果要将内容转为数组需要使用values属性值,而读取csv时生成的直接就是一个数组。
- 读取excel生成的数组时取第一列的值为data[i][0],读取csv生成的数组时取第一列的值为data[0][i],这是因为前者的i代表excel中的第几行,后者的i代表的时第一列的第几个值。
pandas按列的值读取excel的方法:
df = pd.read_excel(xlsx_path, keep_default_na=False)
for row in df.itertuples():
row_name = getattr(row, '内容1')
先利用itertuples方法获取excel表每行的元组属性集合,
具体格式如下:Pandas(Index=58, 内容1=‘这里,我来分享一个我自己的故事。’)然后使用getattr获取列名为文件名称的内容。
ps:这个是截取的第58行
pandas新建一个excel表
list1 = [1, 2, 3]
# 初始化一个map
df = pd.DataFrame({'ID': list1, 'Name': ['Tim', 'Victor', 'Nick']})
# 定义ID为索引
df = df.set_index('ID')
# 新增列
data['性别'] = None
# 新增行
data.loc[3] = ['王五', 100, '男']
df.to_excel(r'C:/test/test/output.xlsx')