16个推荐系统开放公共数据集整理分享

(本文由深度学习与NLP编译)

本文主要整理了一些与推荐系统相关的高质量的数据集。整理自Stack Overflow、一些文章、推荐站点和学术实验。其中,大多数数据集都是免费、开放的,但有些不是,需要获得许可或引用作者的工作才能使用。此外,其中也包含一些预处理数据,可用于学术实验。链接和数据集描述。

 

Book

· 1. Book Crossing

BookCrossing(BX)数据集由Cai-Nicolas花了的4周(2004年8月/ 9月)从Book-Crossing社区中爬取得到的。

· 下载链接http://www2.informatik.uni-freiburg.de/~cziegler/BX/

 

电子商务

· 2. Amazon

该数据集包括自1996年5月至2014年7月,来自亚马逊上的1.428亿产品的评论和metadata。

· 下载链接http://jmcauley.ucsd.edu/data/amazon/

 

· 3. Retailrocket推荐系统数据集

该数据集由三个文件组成:一个行为数据集(events.csv),一个属性数据集(item_properties.сsv)和一个类目树数据集(category_tree.сsv)。该数据来自现实世界的电子商务网站。

· 下载链接https://www.kaggle.com/retailrocket/ecommerce-dataset

 

音乐

· 4. Amazon Music

该数字音乐数据集包含来自亚马逊的评论和元数据

· 下载链接:http://jmcauley.ucsd.edu/data/amazon/

 

· 5. Yahoo Music

该数据集是一个快照,收集了音乐社区对各种音乐艺术家的偏好。

· 下载链接https://webscope.sandbox.yahoo.com/catalog.php?datatype=r

 

· 6. LastFM(Implicit)

该数据集收集了Last.fm网站上2千名用户的社交网络、tagging和music artist listening信息。

· 下载链接https://grouplens.org/datasets/hetrec-2011/

 

· 7. Milion Song Dataset

Million Song数据集是一个免费的数据集,提供了一百万条当代流行音乐曲目相关的的audio features和metadata。

· 下载链接https://labrosa.ee.columbia.edu/millionsong/

 

电影

· 8. MovieLens

GroupLens Research已经从他们的电影网站收集整理的rating数据集。

· 下载链接https://grouplens.org/datasets/movielens/

 

· 9. Yahoo Movies

该数据集包含从两个不同来源收集的歌曲的rating数据集。第一个来源是用户在与Yahoo上使用音乐服务是产生的rating数据。

· 下载链接https://webscope.sandbox.yahoo.com/catalog.php?datatype=r

 

· 10. CiaoDVD

CiaoDVD是2013年12月从http://dvd.ciao.co.uk网站上抓取的DVD类别数据集。

· 下载链接https://webscope.sandbox.yahoo.com/catalog.php?datatype=r

 

·11. FilmTrust

FilmTrust是2011年6月从整个FilmTrust网站上抓取的一个小型数据集。

· 下载链接https://www.librec.net/datasets.html

 

· 12. Netflix

这是Netflix奖竞赛中使用的官方数据集。

· 下载链接http://academictorrents.com/details/9b13183dc4d60676b773c9e2cd6de5e5542cee9a

 

游戏

· 13. Steam Video Games

这是一个用户行数据集,包含:user-id,game-title,behavior-name,value。包括“purchase”和“play”数据集。购买了,puchase的值为1,而“play”的值表示用户播放音乐的时长。

· 下载链接https://www.kaggle.com/tamber/steam-video-games/data

 

Jokes

· 14. Jester

该笑话数据集包含来自73,496个用户,关于100个笑话的410万连续rating数据(-10.00到+10.00)

· 下载链接http://www.ieor.berkeley.edu/~goldberg/jester-data/

 

餐饮

·15. Chicago Entree

该数据集包含用户与Entree Chicago餐厅推荐系统交互的记录数据。

· 下载链接:http://archive.ics.uci.edu/ml/datasets/Entree+Chicago+Recommendation+Data

 

动漫

·16. 动漫推荐数据库

该数据集包含来自12,294个动漫的73,516个用户的用户偏好数据。每个用户都可以将动画添加到已完成的列表中并为其评分,该数据集把这些评级整理起来。

· 下载链接https://www.kaggle.com/CooperUnion/anime-recommendations-database

 

其他数据集

· GroupLens数据集

· 下载链接:https://grouplens.org/datasets/

 

· LibRec数据集

· 下载链接:https://www.librec.net/datasets.html

 

· Yahoo Research数据集

· 下载链接:https://webscope.sandbox.yahoo.com/catalog.php?datatype=r

 

· 斯坦福大型网络数据集汇编

· 下载链接:https://snap.stanford.edu/data/

### 回答1: 1000个12导联ECG心电图数据集是一项非常有价值的医疗资源,这些数据可以用于心电图诊断和研究方面的科学研究。通过这些数据集,医生可以更加准确地诊断心脏问题,包括急性心肌梗塞、心律失常等,有效提高心脏病患者的治疗质量。此外,这些数据还可用于进行心脏疾病的研究,如心血管疾病的发生机制、早期预测和预防等方面的深入探究。同时,这些数据可以被用于开发新型的心电监测设备和心电分析工具,这对于普及心电监测技术和提高心电诊断质量也具有非常重要的意义。 然而,我们在使用这些数据集时要注意保护数据集的隐私权和安全,遵循有关数据保护的隐私政策和规定。同时,在数据分析和研究过程中,我们还要遵循科学可信的原则,避免出现数据误解或者误导的情况。最后,我们也应该鼓励更多的医疗机构和研究单位将他们的心电图数据集贡献到公共资源库中,以促进医疗数据资源的共享和开放。 ### 回答2: 12导联ECG心电图数据集是医学领域中的一种非常重要的数据集,它可以用于多种疾病的诊断和检测,包括心脏病、糖尿病等。该数据集通常包含1000个患者的心电图数据,每个患者的数据包含12个不同的导联信号。 这样的数据集可以提供大量的信息,但同时也需要大量的技术来进行处理和分析。为了得到有用的信息,必须使用特殊的软件和技术来分析心电图信号并将其转换为数字信号。 在医学研究和诊断中,12导联ECG心电图数据集可以帮助医生快速诊断和发现一系列疾病。对于心脏病的检测,它可以为医生提供详细的信息,包括心脏功能和电信号,从而帮助医生进行合适的诊断和治疗。 总之,12导联ECG心电图数据集对于医学领域来说具有非常重要的意义,它可以为医生和患者提供帮助,同时也需要先进的技术和算法来处理分析。 ### 回答3: 12导联心电图是心脏疾病诊断中不可或缺的检查项目,其能够提供多种心电信号的数据,反映患者心脏的多个方面的功能状态。在医学研究、心脏病诊断以及新一代的智能医疗设备中,12导联心电图的数据集也越来越受到重视。 1000个12导联心电图数据集意味着有1000个患者的12导联心电图数据,这些数据可以帮助医学专业人员进行心脏病的临床研究,精准分析心脏病症状及其病因。数据集的构建、归集和整理是一项耗费人力、物力以及时间成本的工作,但这样的数据集也会为未来数据科学家、医学工作者、医疗器械研发者、医生以及患者等带来福音。 在未来,这样的大规模数据集也可能为人工智能、深度学习以及其他现代技术的应用提供更可靠的数据支持,探究潜在的心脏疾病特征,预测个体的心血管健康风险,促进个性化医疗的发展等。 总之,1000个12导联心电图数据集具有很高的重要性。未来的医疗发展需要从更多角度,更充分,更准确地掌握现代医疗数据,利于科技和医学的相互融合,助力临床诊断和治疗的有效实施。
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值