数据集搜索网址汇总

mine

https://toolbox.google.com/datasetsearch
https://github.com/awesomedata/awesome-public-datasets
http://www.cvpapers.com/datasets.html
https://github.com/jbhuang0604/awesome-computer-vision#datasets
https://small-obstacle-dataset.github.io/

out

  1. datasetsearch

https://datasetsearch.research.google.com

    它可以让你搜索到已经根据 schema.org 标准进行正确标记的可用数据集。你可以看到所有搜索结果,每个结果包括数据集名称、最近更新时间、数据集简介等。

2.Google Trends

https://trends.google.com/trends/explore

    使用这个工具,你可以搜索关键字并查看有关它们的各种信息,包括按照时间的搜索热度、按照地区的搜索热度、相关主题、相关搜索等。你可以选择不同的选项,包括要查看的国家,将其缩小到各个类别,或将搜索范围限制在所有网站、图片、新闻、购物或 YouTube 上。

3.U.S. Census Bureau

   你可以从这个数据集中获得与人口、经济和地理相关的信息,也可以按主题或搜索进行浏览。如果你需要统计内容,这会是一个很好用的工具。它们有一些很好的可视化效果,你也可以将其嵌入到内容中。

4.EU Open Data Portal

https://data.europa.eu/euodp/en/data/

   该数据集中的可用数据包括地理、金融、统计学、选举结果、法案、犯罪、交通、健康、环境和科学研究等信息,这是一个既可搜索又可浏览的平台。

5.美国 Data.gov

https://www.data.gov/

   作为美国政府开放数据的主页,该网站允许使用者访问联邦、州、地方和部落政府提供的各种主题信息。

6.英国 Data.gov

https://data.gov.uk/

与美国的 Data.gov 类似,该网站允许访问各种主题的数据。这些数据由中央政府、地方当局和公共机构提供。

7.Health Data

https://healthdata.gov/

   该网站可搜索的主题包括医疗设备、环境卫生、药物滥用、精神健康等等。

8.The World Factbook

https://www.cia.gov/library/publications/the-world-factbook/

   该数据集包含 267 个国家和地区的信息,每周更新一次有关全球的信息。你可以选择要查看的国家,然后点击你喜欢的任何主题(如经济或交通)。该网站可检索,它还有一个关于世界领导人和一个关于 CIA Maps 的专栏。

9.Altmetric

https://www.altmetric.com/top100/2018/

   该数据集中的有些数据是需要付费的,但它们还提供每年最热的前 100 篇文章,最新的是 2018 年的数据,可以往前搜索到 2013 年的数据。他们还提供一些免费工具。

10.Open Corporates

https://opencorporates.com/

   这是全球最大的公司开放数据集,可以让你访问超过 1 亿家公司的信息。你可以按公司或高级职员进行搜索,并在需要的时候限制你的搜索范围。

11.国家海洋和大气管理局

(National Center for Environmental Information)

https://www.ncdc.noaa.gov/data-access

   这个数据集涵盖地球物理学、大气和海洋数据。他们目前是世界上最大的气候和天气信息提供商。他们还提供了旧工具的链接,这些工具目前可能在网站上不可使用,但可用于其他地方。

12.Reddit

https://www.reddit.com/r/datasets/

   虽然你需要注册,但它是免费的。你可以搜索数据集并查找提供信息和请求信息的人。总的来说,Reddit 也是一个寻找信息并了解行业趋势的好地方。

13.Kaggle 数据集

https://www.kaggle.com/datasets

  它目前有将近 16,000 个数据集,你可以找到从运动队球员统计到洛杉矶停车任何范畴的数据。

14.NASA 的 Earth Data

https://earthdata.nasa.gov/?_fsi=BqJ6IiI5

   它包含了美国宇航局的地球观测数据,其中包含如 NC 地表温度和碳通量等信息。

15.Pew Internet

https://www.pewresearch.org/internet/datasets/?_fsi=BqJ6IiI5

   如果你需要的是社会学数据,这是一个很好的数据源。你还可以通过浏览找到一些有趣的文章。虽然需要注册才能查看和下载数据集,但它也是免费的。

16.疾病控制由于预防中心

(Centers for Disease Control and Prevention)

https://www.cdc.gov/datastatistics/index.html

   该网站包括各种健康主题,可让你访问大量可浏览和可搜索的数据。甚至可以通过各种与主题相关的网站创建自己过滤的数据集。

17.美国劳工统计局

(Bureau of Labor Statistics)

   你可以在这里找到有关美国劳动力市场活跃度、工作条件和价格变化的数据。

18.Five Thirty Eight

https://data.fivethirtyeight.com/

   这个网站有关于政治、体育、科学、健康、经济和文化方面的数据。

19.Group Lens

https://grouplens.org/datasets/

   它包含几个可用的数据集,这些数据集对特定的项目很有用。一些数据集已有十多年的历史。你可以在这里得到很多关于书籍和电影的信息。

20.GitHub 上的 BuzzFeed News

   这个网站给你提供了来自 Buzzfeed 的数据。如果你想了解 2016 年至 2018 年期间的假新闻,那么这就是一个不错的选择。

参考文献:

https://mp.weixin.qq.com/s/ir2DTNkiRGkZjhfupMSE_w

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 豆瓣电影数据集是一个非常丰富的电影相关信息汇总资源,拥有大量电影的基本信息、评分、评论等数据。这个数据集被广泛应用于电影推荐系统、电影数据分析以及社会科学研究等领域。 首先,豆瓣电影数据集可以用来构建和改进电影推荐系统。通过分析用户对电影的评分、喜好等数据,可以基于用户的兴趣和偏好为其推荐相似类型的电影。这对于用户来说是非常方便和实用的,可以节省他们搜索电影的时间,同时也丰富了他们的观影体验。 其次,豆瓣电影数据集还可以用于电影数据的分析和研究。通过统计和分析用户对电影的评分、评论等数据,可以发现电影市场的潜在趋势和用户的观影喜好。这对电影制片方和电影院线来说非常重要,有助于他们更好地了解观众的需求,制定更准确的市场推广策略,提高电影的票房和口碑。 此外,豆瓣电影数据集还可以用于社会科学研究。通过分析用户对不同类型电影的评分、评论和偏好,可以揭示人们的价值观和文化偏好等方面的信息。这对社会学家、心理学家等研究人员来说是非常有价值的,可以通过这些数据了解人们的娱乐选择和审美趋势,进一步研究社会文化和心理特征。 综上所述,豆瓣电影数据集的应用十分广泛,不仅可以改进推荐系统,还可以为电影市场和社会研究提供有价值的信息。 ### 回答2: 豆瓣电影数据集是一个非常有价值的资源,它包含了大量与电影相关的信息,比如电影的名称、导演、演员、评分、评论等。这个数据集对于许多领域的研究和分析都非常有用。 首先,豆瓣电影数据集可以被用于电影推荐系统的开发。通过分析用户对电影的评分和喜好,可以构建个性化的推荐算法,帮助用户发现与其兴趣相关的电影。这样的推荐系统可以提高用户的观影体验,带来更多的电影收益。 其次,豆瓣电影数据集也可以用于市场调研和电影评价分析。通过对电影的评分和评论进行挖掘,可以了解用户对不同类型电影的喜好,指导电影制作公司在拍摄、推广过程中的决策。同时,分析评论中的情感倾向,可以揭示观众对电影的评价和期待,为电影制作提供反馈。 另外,豆瓣电影数据集还可以用于电影产业的研究。我们可以分析电影的上映时间、票房收入和评分之间的关系,探索何种因素影响着电影的商业成功。同时,可以对电影市场进行细分,了解观众在不同地区和年龄段对电影类型的偏好,为电影发行和推广提供指导。 总的来说,豆瓣电影数据集是一个非常丰富的资源,可以在电影推荐、市场调研和电影产业研究等领域发挥重要作用。通过深入挖掘和分析这个数据集,我们可以更好地了解观众的需求,帮助电影产业实现更好的发展。 ### 回答3: 豆瓣电影数据集是一个非常有用的资源,它涵盖了众多电影的信息,包括电影的名称、导演、演员、评分、评论等。豆瓣电影数据集的价值在于它可以被用来进行各种分析和研究。 首先,豆瓣电影数据集可以用于市场调研和商业分析。通过分析电影的评分、评论数量和用户观看偏好,可以帮助电影制片公司和影视平台了解用户喜好,从而更好地制定市场策略和推广活动,提高影片的票房和观影率。 其次,豆瓣电影数据集可以被用于电影推荐系统的建设。通过分析用户的历史评分和观影记录,可以推断出用户的偏好,并向用户推荐适合他们口味的电影。这种个性化推荐不仅可以提高用户的观影体验,还可以增加用户的黏性,提升平台的用户留存率。 此外,豆瓣电影数据集还可以用于研究电影产业的发展趋势。通过分析电影的类型、制作地区、票房等指标,可以了解全球电影市场的状况,发现电影行业的新趋势和商机,为电影行业的发展提供参考。 总之,豆瓣电影数据集的价值是多方面的。它不仅可以帮助电影制作公司和影视平台提高市场竞争力,还可以为用户提供更好的观影体验,促进电影行业的繁荣发展。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值