读取、处理Yelp数据集

smallTutou

已于 2022-04-08 11:16:10 修改

阅读量3.6k

点赞数

分类专栏： Python tensorflow 推荐系统文章标签： python tensorflow

于 2022-04-08 11:14:49 首次发布

本文链接：https://blog.csdn.net/smallTutou/article/details/124036697

版权

Yelp数据用户ID编码商家ID编码评论处理数据清洗

关键词由CSDN通过智能技术生成

##读取、处理Yelp数据集

import pandas as pd
import json

reviews_path =r"../yelp_dataset/yelp_academic_dataset_review.json"

'''
读取原始数据
'''
file = open(reviews_path, 'r', encoding="utf-8")

users_id = []
items_id = []
ratings = []
reviews = []
dates = []

for line in file:
     js = json.loads(line)
      print(js)