以母亲相关指标与婴儿睡眠为背景引出题设。给出了一组数据集,包括 390名 3 至 12 个月婴儿以及其母亲的相关数据。这些数 据涵盖各种主题,母亲的身体指标包括年龄、婚姻状况、教育程度、妊娠时间、分娩方式,以及产妇心理指标CBTS(分娩相关创伤后应激障碍问卷)、EPDS (爱丁堡产后抑郁量表)、HADS(医院焦虑抑郁量表)和婴儿睡眠质量指标包括整晚睡眠时间、睡醒次数和入睡方式。
对于数据类型题目,上来第一步不是直接读问题,而是处理数据,对于下面这组数据集一定存在异常值、缺失值。所以,首先进行数据预处理是必须的。
例如,对于婚姻状况这种的数据。婚姻状况,未婚以及已婚,但是存在有人的婚姻状况是3、6是异常值,对于这样的数据需要处理,至于处理方法选择剔除或者进行插值处理等等,就根据队伍情况进行选择即可。
问题一,是否存在这样的规律,即进行简单的分析结果,绘制散点图,进行相关性分析即可;对于相关性分析,可以选择Pearson‘皮尔逊’相关系数、Spearman‘斯皮尔曼’相关系数或者其他的相关系数指标,