批量提取、整合所需范围天数的产奶量数据

####批量整合产奶量数据
###下载系统数据(目前只能下载日产奶记录中的前一百页)
将保存的excel数据整理,保留 牛号	胎次	挤奶日期	产犊日期	泌乳天数	日产奶量
                            id	    tc		jnrq		cdrq		milkday		milkyield
###python批量提取
##1.写代码

现在一个数据文件day_milk_yield.csv,有几列数据,其中包括id、milkday,milkyield等列。
写一个循环命令找到同一id,且milkday大于0、小于13的行,并对这些行数据进行合并并输出到新文件。
在上述结果文件merged_data.csv中,通过循环找到在id.txt中ID列所出现过的id,并合并
具体代码为:
#将以下代码保存在后缀名为.py的文件中
import pandas as pd

df = pd.read_csv('day_milk_yield.csv') #读取数据文件

id_df = pd.read_csv('id.txt', header=None, names=['id']) #读取ID文件

id_list = id_df['id'].tolist() #获取在id.txt中出现的ID列表

merged_data = pd.DataFrame() #创建一个空的DataFrame用于存储合并后的数据

   for id_value in id_list: # 循环遍历每个ID
    
    subset = df[(df['id'].astype(str) == str(id_value)) & (df['milkday'] >= 2) & (df['milkday'] <= 13)] #获取特定ID的子数据集

    merged_data = merged_data.append(subset) #合并子数据集到新的DataFrame

merged_data.to_csv('merged_data_1.csv', index=False) #将合并后的数据保存到新文件

##2.数据文件day_milk_yield.csv,代码文件py1.py,id文件id.txt。


#运行python代码,得到结果文件
python py1.py

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值