MIMIC-III 数据集处理,遇到问题如下:
由入院时间减去出生时间计算入院时年龄,遇到报错:OverflowError: Overflow in int64 addition。查看了一下本地的 pandas 版本为 1.3.5 ,如下所示:
Github Issues 有好心人回答了一些解决方法,主要包括降低 pandas 版本为 0.23.4 或 0.20.3(但 pandas 是很多库的依赖,这可能导致与其他依赖库发生冲突,一般不要轻易改变它的版本)。所以最好是改写一下代码:
df1_2['ADMITTIME'] = pd.to_datetime(df1_2['ADMITTIME']).dt.date
df1_2['DOB'] = pd.to_datetime(df1_2['DOB']).dt.date
df1_2["AGE"] = df1_2.apply(lambda e: (e['ADMITTIME'] - e['DOB']).days / 365, axis=1)
结果如下:
Reference:
- Github Issues:https://github.com/YerevaNN/mimic3-benchmarks/issues/84