暑期实训log7

协同过滤推荐算法实现。

已有训练好的推荐模型。模型的输入:
1、食谱id的索引(数据清洗出的新数据(约1000条)在原数据(约17万条)的索引),类型为tensor数组。
2、用户id。类型是long数组,长度等于食谱id,即一个用户id的重复。

首先获取食谱id的索引:
从数据清洗同学给的新数据中,提取出纯id的csv文件,再利用python转化为npy文件。
在这里插入图片描述

pdata = pd.read_csv("id.csv", header=None)
npdata = pd.DataFrame(pdata).values
npdata = npdata.ravel()  #降维[[...]]->[...]
np.save("indexT.npy", npdata)

直接转换得到的是二维numpy数组:
在这里插入图片描述

需要降成一维(其实就是双括号改为单括号),否则模型读取会出错。

然后已有文件recipe_index_list_new.npy:[172946]recipe在原数据中和现数据中的索引对应关系。
利用这个文件,和上面获得的清洗后的食谱id的npy文件,就可以获得模型需要的新数据的索引。

data = np.load("recipe_index_list_new.npy")
for i in npdata:
    x = np.where(data == i)
    print (x[0])
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值