####批量整合产奶量数据
###下载系统数据(目前只能下载日产奶记录中的前一百页)
将保存的excel数据整理,保留 牛号 胎次 挤奶日期 产犊日期 泌乳天数 日产奶量
id tc jnrq cdrq milkday milkyield
###python批量提取
##1.写代码
现在一个数据文件day_milk_yield.csv,有几列数据,其中包括id、milkday,milkyield等列。
写一个循环命令找到同一id,且milkday大于0、小于13的行,并对这些行数据进行合并并输出到新文件。
在上述结果文件merged_data.csv中,通过循环找到在id.txt中ID列所出现过的id,并合并
具体代码为:
#将以下代码保存在后缀名为.py的文件中
import pandas as pd
df = pd.read_csv('day_milk_yield.csv') #读取数据文件
id_df = pd.read_csv('id.txt', header=None, names=['id']) #读取ID文件
id_list = id_df['id'].tolist() #获取在id.txt中出现的ID列表
merged_data = pd.DataFrame() #创建一个空的DataFrame用于存储合并后的数据
for id_value in id_list: # 循环遍历每个ID
subset = df[(df['id'].astype(str) == str(id_value)) & (df['milkday'] >= 2) & (df['milkday'] <= 13)] #获取特定ID的子数据集
merged_data = merged_data.append(subset) #合并子数据集到新的DataFrame
merged_data.to_csv('merged_data_1.csv', index=False) #将合并后的数据保存到新文件
##2.数据文件day_milk_yield.csv,代码文件py1.py,id文件id.txt。
#运行python代码,得到结果文件
python py1.py