处理特征向量和离散特征

在腾讯社交广告大赛中,面对包含interests1, interests2等离散特征的数据,可以使用LabelEncoder将离散属性转换为数字表示,接着用OneHot编码将每个特征转化为稀疏矩阵,再通过hstack进行列拼接。同时介绍了CountVectorizer在处理特征向量的应用,将得到的稀疏矩阵与之前的结果进行Hstack组合,以供算法使用。" 122858993,12117173,全球与中国耳鼻咽喉镜和支气管镜设备市场2022-2028年分析报告,"['医疗设备', '医疗器械市场', '耳鼻咽喉科', '内窥镜', '医疗技术']
摘要由CSDN通过智能技术生成
在最新的腾讯的社交广告大赛中,数据如下,如何处理这种向量的特征

比如intersets1,interests2....

LBS,950,
age,4,
carrier,1,
consumptionAbility,2,
ct,3 1,
education,7,
gender,2,
interest1,93 70 77 86 109 47 75 69 45 8 29 49 83 6 46 36 11 44 30 118 76 48 28 106 59 67 41 114 111 71 9,
interest2,46 19 13 29,
interest5,52 100 72 131 116 11 71 12 8 113 28 73 6 132 99 76 46 62 121 59 129 21 93,
kw1,664359 276966 734911 103617 562294,
kw2,11395 79112 115065 77033 36176,
marriageStatus,11,
os,2,
topic1,9826 105 8525 5488 7281,
topic2,9708 5553 6745 7477 7150,
uid,26325489
首先上代码
def batch_predict(data,index):
    one_hot_feature=['LBS','age','carrier','consumptionAbility','education','gender','house','os','ct','marriageStatus','advertiserId','campaignId', 'creativeId',
           'adCategoryId', 'productId', 'productType']
    vector_feature=['appIdAction','appIdInstall','interest1','interest2','interest3','interest
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值