我这里的方法或许不是很好,主要做法是使用列表和字典进行转换,感觉很繁琐,但是也是一种方法。
如果有大神有更好的方法,请留言。
# -*- coding:utf-8 -*-
#author:zgd
import pandas
import csv
# with open("url_features_3_zgd.csv", 'r') as f:
# train_csv = csv.DictReader(f) ###读取和加载查询的特征集
# print train_csv.fieldnames
# f.close()
# firm_type = []
# not_firm_type = []
# for row in train_csv:
# if row["firmware_bool"] == "1":
# if row["getContentType"] not in firm_type:
# firm_type.append(row["getContentType"])
# elif row["firmware_bool"] == "0":
# if row["getContentType"] not in not_firm_type:
# not_firm_type.append(row["getContentType"])
# else:
# print "----------"
# print firm_type
# print not_firm_type
firm_type = [