特征工程是什么?
特征工程是将原始数据转换为更好地代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的模型准确性
特征抽取对文本等数据进行特征值化 特征值化是为了计算机更好的去理解数据**
from sklearn.feature_extraction.text import CountVectorizer
#实例化
vector=CountVectorizer()
#调用fit_transform输入并转换数据
res=vector.fit_transform(['Life is short ,i like python','Life is too long,i dislike python'])
#打印结果
print(vector.get_feature_names())
print(res.toarray())
from sklearn.feature_extraction import DictVectorizer
#实例化
dict=DictVectorizer()
#调用fit_transform
data=dict.fit_transform([{
'city': '北京','temperature':100},{
'city': '上海','temperature':60},{
'city': '深圳','temperature':30}])
print(data)
from sklearn.feature_extraction import DictVectorizer
#实例化
dict=DictVectorizer(sparse=False)
#调用fit_transform
data