掘金15W沸点简单分析(二)
一、数据预处理与入库
获取到了原始数据之后,下一步就是清洗入库。
1.1 数据模型
因为是简单分析,所以只获取话题、用户、消息三块内容。具体如下:
class Pins(object):
"""
沸点
"""
msg_id = None # 沸点ID
topic_id = None # 话题ID
topic_title = None # 话题名称
user_id = None # 用户ID
user_name = None #