读取原始数据
1.读取第一行数据
2.读取指定的行列
3. 按照列名称读取
4.遍历增加数据
5.将亚马逊的大类产品数提取出来。
数据结构为:
提取大类名称和小类名称和对应的排名数据:
def mongo_rank(asin,table):
table_name=db[table] # 数据库链接
one_data =table_name.find_one({'asin':asin},{'_id':0,'ranks':1}) # 获取对应的数据
return one_data
for idx , val in df_one.iterrows():
print(idx , val)
mongo_data=mongo_rank(val['asin'],val['wordsKinds'])
for each_kind in mongo_data['ranks']:
if each_kind['rank']== int(val['rank']) :
df_one.loc[idx,('big_kind_rank')]=each_kind['rank']
df_one.loc[idx,('big_kind_name')]=each_kind['category']
else:
df_one.loc[idx,('small_kind_rank')]=each_kind['rank']
df_one.loc[idx,('small_kind_name')]=each_kind['category']
break
结果可以