以一个Excel .xls文件中的数据为例
现在我手上有一个Excel 数据表,如下图所示:
任务:需要把 ‘age’ 这一列的数字提取出来。
实现步骤:
1.在python中打开这个文件:
// 导入需要的包,pandas,用于读取Excel文件和处理dataframe类型的数据
import pandas as pd
// 填入Excel文件所在地址
file_path=' '
//读取文件,在计算机中以DataFrame的格式存放
c_df = pd.read_excel(file_path)
2.将’age’这一列中的数字提取出来,放入新的一列名叫‘age_num’的列中。
// c_df['age'] 将c_df中的‘age’列提取出来
// .str将其中的字符串取出来
// .replace(r'[^0-9]', '') 将这一列中的字符串提取出来
c_df['age_num'] = c_df['age'].str.replace(r'[^0-9]', '