连续型字段,离散型字段

连续型字段,离散型字段

    例如:为什么年龄是连续型字段?
    我们举个例子,为什么年龄是连续型而不是离散型?区分这两者的关键点在于有穷性,离散型的字段是可以列举出所有情况的,如在“婚姻状况”字段中0表示未婚、1表示已婚。而连续型无法列举出所有取值,即使是年龄这一项仅分布在19-80岁之间,我们也视作无法列举全部。或者换一种说法,如果将年龄视为离散型,那么这个离散型变量的特征值情况就包括19-80之间60多个数字取值,而实际上19与20之间的差距不足以成为离散,一个具有60多种类型的离散字段也很难表达特征,所以年龄就是一个典型的连续型字段。
    另,数据字段的类型并不会受到统计时间段(例如数据在6月31日至8月31日时间段内收集)的影响,只由它本身性质和代表意义决定,一个通用的判断办法是假设它为离散型,那么相邻两个取值真的有足够离散的差别么? 以上。
    如果大家有什么问题或者更好的答案,欢迎讨论,共同进步!如果有表达不清的问题,欢迎您指教。

相关推荐
©️2020 CSDN 皮肤主题: 1024 设计师:白松林 返回首页