该专栏用于毕业论文项目进度记录及跟踪以及日常吐槽。
@ 实时更新中…
现有工作统计
-
用户评论交互数据:现有未筛除数据10539条,预估筛完后仅剩余6000条,数据量过少。使用后裔采集器爬取七麦常出现异常情况,需要不停更换网络。之前预期,用户数5000,APP数据量12000~15000。先慢慢爬着…
4784(总榜)
3723(总榜,100个已经全部爬完)
2032(社交类跳过前20个) -
KGAT模型:模型已经跑通,但是代码和原理还没看懂
2021/6/14
目前需要解决的问题是如何能够将爬取的数据转化为三元组!
搞懂了neo4j:
(1)https://www.w3cschool.cn/neo4j/neo4j_cql_introduction.html
(2)https://zhuanlan.zhihu.com/p/88745411
2021/6/15
开会日…。组会讲KGAT模型+数据集+实验结果。
KB4Rec:将三个热门领域(电影/音乐/图书)的物品与知识图谱Freebase链接。以“物品ID–