描述性统计分析与可视化
手动反爬虫,禁止转载:原博地址 https://blog.csdn.net/lys_828/article/details/116164981
知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的恶意爬取信息
1 变量的度量类型
在实际业务或者实验过程中,通常遇到的变量的度量类型分为三种:名义、等级、连续
- 名义变量: 就是包含信息最少,只有名义上的差别,没有高低贵贱之分,比如性别,民族等,名义变量的取值是没有顺序之分的。(易错点:名义变量不一定只能用字符表示,比如性别,男对应1,女对应0,那么这里的0和1就代表名义变量的取值,也叫作编码)。 比如饮料的类型
-
等级变量: 带有顺序的名义变量,比如教育水平,小学、中学、高中、大学等。同时也可以使用数字编码的方式表示,不一定要求取值必为字符。比如饮料包装杯的大小