说明:DictVectorizer的处理对象是符号化(非数字化)的但是具有一定结构的特征数据,如字典等,将符号转成数字0/1表示。
#-*- coding:utf-8 -*-
#学习目标:使用DictVectorizer对使用字典存储的数据进行特征抽取和向量化
#定义一组字典列表,用来表示多个数据样本(每个字典代表一个数据样本)
measurements = [{
'city':'Beijing','temperature':33.},{
'city':'London','temperature':12.},{
'city':'San Fransisco','temperature':