连续型字段,离散型字段
例如:为什么年龄是连续型字段?
我们举个例子,为什么年龄是连续型而不是离散型?区分这两者的关键点在于有穷性,离散型的字段是可以列举出所有情况的,如在“婚姻状况”字段中0表示未婚、1表示已婚。而连续型无法列举出所有取值,即使是年龄这一项仅分布在19-80岁之间,我们也视作无法列举全部。或者换一种说法,如果将年龄视为离散型,那么这个离散型变量的特征值情况就包括19-80之间60多个数字取值,而实际上19与20之间的差距不足以成为离散,一个具有60多种类型的离散字段也很难表达特征,所以年龄就是一个典型的连续型字段。
另,数据字段的类型并不会受到统计时间段(例如数据在6月31日至8月31日时间段内收集)的影响,只由它本身性质和代表意义决定,一个通用的判断办法是假设它为离散型,那么相邻两个取值真的有足够离散的差别么? 以上。
如果大家有什么问题或者更好的答案,欢迎讨论,共同进步!如果有表达不清的问题,欢迎您指教。
1318

被折叠的 条评论
为什么被折叠?



