python
小鼠2021
heloo
展开
-
pandas.get_dummies()
参考博客1 参考博客2 one hot 编码 形式和定义 one hot 编码,其为一位有效编码,主要是采用N位状态寄存器来对N个状态进行编码,每个状态都有独立的寄存器位,并且在任意时候只有一位有效。 这些特征值并不是连续的,而是离散的,无序的。 通常我们需要对其进行特征数字化。 特征数字化 性别特征:[“男”,“女”] 按照N位状态寄存器来对N个状态进行编码的原理,咱们处理后应该是这样的(这里只有两个特征,所以N=2): 男 → 10 女 → 01 国家特征:[“中国”,"美国,“法国”](N=3)原创 2021-11-23 14:54:39 · 668 阅读 · 0 评论 -
sklearn.prepocessing.LabelEncoder()
参考博客1 参考博客2 函数作用 将不同的类别进行编码 函数的使用 使用LabelEncoder()对数据集编码 weather = ['sunny','windy','cloudy','rainy','sunny'] en = sklearn.prepocessing.LabelEncoder() en = en.fit(['sunny','windy','cloudy','rainy']) weather = en.transform(weather) # weather = [2 3 0 1 2]原创 2021-11-23 14:20:53 · 1313 阅读 · 0 评论