特征预处理(归一化)
预处理方法:
归一化
归一化公式
归一化MinMaxScaler
三个特征同等重要的时候,需要进行归一化处理。
目的:使得一个特征对最终的结果不会造成特别大的影响
稳定性较差。
标准化
数据标准化与缺失值的填补
#!usr/bin/env python
# -*- coding:utf-8 -*-
"""
@author: Administrator
@FILE: .py
@time: 2021/09/30
@desc:
"""
import numpy as np
from sklearn.feature_extraction import DictVectorizer
from sklearn.feature_extraction.text import CountVectorizer, TfidfVectorizer
import jieba
from sklearn.preprocessing import MinMaxScaler, StandardScaler, Imputer
def dictvec():
"""
字典数据抽取
:return:
"""
#实例化
dict=DictVectorizer()
#调用fit_transform
data=dict.fit_transform([{
'city':'北京','temperature':100},{