![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
mumuaixx
这个作者很懒,什么都没留下…
展开
-
One-hot编码
处理分类数据(有限个字符型的数据)方法:1.删除非数值型数据(也就是这些分类数据)drop(object);2.标签编码;from sklearn.preprocessing import LabelEncoderlabel_encoder=LabelEncoder()label_encoder.fit([])(拟合)label_encoder.transform([])(转化)//fit_transform()3.独热编码。独热编码:对分类(类别)数据:使用标签编码包含了标签的大小关系原创 2021-03-27 11:06:44 · 140 阅读 · 0 评论 -
卡方检验思想
**卡方检验思想总结卡方检验思想:1.假设数据服从某种分布,或某种模型;2.计算出符合此模型的数据,即为期望数据;3.实际观测到的数据和2中计算得到的期望数据相比较(卡方检验的公式);4.得到的卡方值过大,说明偏差过大,则拒绝假设模型。卡方检验适用于类别变量 ,如好、坏等分类。卡方检验公式:χ²=∑(Oi-Ei)²\Ei自由度:df=(row-1)(column-1)什么是自由度:自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数。卡方表:row-df原创 2021-03-26 17:21:11 · 2157 阅读 · 0 评论