- 博客(2)
- 资源 (1)
- 收藏
- 关注
原创 医学数据预处理操作流程
医学数据预处理本次任务的目的是处理PO2,PCO2两个指标。这两个指标均为病人的血气指标,以一定的时间间隔采集。一个病人一次住院期间可能收集一次或者多次。要求,按照采集时间的前后顺序,汇总每个病人每次住院期间的所有的pO2, pCO2指标值。涉及到的预处理方法包括插值,去噪,缺失值填充,离群点数据处理,可视化等。
2024-10-11 20:09:56 213
原创 大模型时代下数据挖掘如何突破重围
在大模型的训练过程中,涉及到大量的用户数据。例如,欧洲的GDPR法规对数据的使用和存储提出了严格的要求,企业需要在数据挖掘时遵循相关法律法规,以避免潜在的法律风险。对于大规模数据集,结合大模型的预训练能力,可以快速完成数据的清洗与预处理,从而为后续的数据挖掘打下良好的基础。因此,如何确保数据的质量,包括数据的准确性、一致性和完整性,是数据挖掘的重要挑战。
2024-10-11 20:06:55 639
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人