Dataset
文章平均质量分 86
一个处女座的程序猿
人工智能硕博学历,拥有十多项发明专利(6项)和软著(9项),包括国际期刊SCI内多篇论文,多个国家级证书(2个国三级、3个国四级),曾获国内外“人工智能算法”竞赛(包括国家级省市级等,一等奖5项、二等奖4项、三等奖2项)证书十多项,以上均以第一作者身份,并拥有省市校级个人荣誉证书十多项。目前也是国内知名博主,连续3年获CSDN十大博客之星,荣获达摩院评测官、阿里社区/CSDN社区/51CTO/华为社区等十多个开发者社区专家博主荣誉,曾受邀阿里/华为/谷歌等社区采访-评审-论坛几十次。截止2022年,AI领域粉丝超100万,文章阅读量超5000万。正在撰写《AI算法最新实战》一书,目前已30万字
展开
-
Dataset之UCI_autos_cars:UCI_autos_imports-85(汽车进口数据集)的简介、安装、案例应用之详细攻略
Dataset之UCI_autos_cars:UCI_autos_imports-85的简介、安装、案例应用之详细攻略目录UCI_autos_imports-85的简介UCI_autos_imports-85的安装UCI_autos_imports-85的案例应用UCI_autos_imports-85的简介UCI机器学习库的汽车数据集,UCI_autos_imports-85数据集是UCI机器学习库中的一个名为“imports-85”的数据集,主要用于汽车进口的数据分析。具体来原创 2024-03-24 23:45:35 · 1820 阅读 · 0 评论 -
Dataset之PTB:Penn Treebank Dataset(PTB 数据集)的简介、安装、使用方法之详细攻略
Dataset之PTB:Penn Treebank Dataset(PTB 数据集)的简介、安装、使用方法之详细攻略目录PTB 数据集的简介PTB 数据集的安装PTB 数据集的使用方法PTB 数据集的简介Penn Treebank Dataset 数据集是一个用于自然语言处理(NLP)和计算语言学研究的标准数据集。它包含来自多种来源的文本,如新闻、书籍和文章。PTB 数据集通常用于语言模型、词性标注、句法分析等任务的训练和评估。官方地址:BOLT Treebank |原创 2018-01-22 15:08:16 · 13081 阅读 · 1 评论 -
Dataset之diabetes:diabetes数据集的简介、下载、使用方法(比较八种机器学习算法实现二分类预测)之详细攻略
Dataset之diabetes:diabetes数据集的简介、下载、使用方法(比较八种机器学习算法实现二分类预测)之详细攻略目录diabetes数据集的简介diabetes数据集的下载diabetes数据集的使用方法diabetes数据集的简介 糖尿病数据集由768个数据点组成,各有9个特征。输出表格的列表字段;9个特征(怀孕次数,血糖,血压,皮脂厚度,胰岛素,BMI身体质量指数,糖尿病遗传函数,年龄,结果)。在768个数原创 2018-06-19 11:55:10 · 18689 阅读 · 2 评论 -
Dataset之NLP之LLMs:大模型核心技术—大语言模型LLMs相关开源数据集的简介(三类数据集【预训练数据/微调数据/测试数据】)、下载(国内外开源数据集平台总结)、使用方法之详细攻略
Dataset之NLP之LLMs:大模型核心技术—大语言模型LLMs相关开源数据集的简介(三类数据集【预训练数据/微调数据/测试数据】)、下载(国内外开源数据集平台总结)、使用方法之详细攻略目录相关文章LLMs相关开源数据集的简介LLMs相关开源数据集的下载LLMs相关开源数据集的使用方法相关文章LLMs:《A Survey of Large Language Models大语言模型综述》的翻译与解读(一原创 2023-08-27 23:06:11 · 1525 阅读 · 0 评论 -
LLMs:MMLU基准(大规模多任务语言理解)的简介(MMLU-ZS/MMLU-FS)、安装、使用方法之详细攻略
LLMs:MMLU基准(大规模多任务语言理解)的简介(MMLU-ZS/MMLU-FS)、安装、使用方法之详细攻略目录MMLU基准的简介MMLU基准的安装MMLU基准的使用方法MMLU基准的简介 2020年9月7日,Dan Hendrycks, Collin Burns, Steven Basart等人提出了一种新的测试方法,用于衡量文本模型的多任务准确性。该测试涵盖了57个任务,包括基本数学、美国历史、计算机科学、法律等多个领域。为了在这个测试中获得高准原创 2023-06-10 02:50:33 · 14060 阅读 · 1 评论 -
Dataset:机器学习领域中常用数据集下载链接集合之详细攻略(持续更新)
Dataset:机器学习领域中常用数据集下载链接集合之详细攻略(持续更新)目录机器学习中常用数据集下载链接集合之详细攻略机器学习中常用数据集下载链接集合之详细攻略sklearn.datasets数据集所有csv文件集合代码链接:sklearn.datasets.load_boston — scikit-learn 1.1.1 documentationfrom sklearn.datasets import load_bostonload_boston([return_X_y原创 2023-06-12 02:30:42 · 3145 阅读 · 0 评论 -
Dataset:adult人口普查收入二分类预测数据集(预测年收入是否超过50k)的简介、下载、使用方法之详细攻略
adult数据,Barry Becker 从 1994 年人口普查数据库中提取,常用于分类预测(确定一个人的年收入是否超过 50K)、数据挖掘与可视化任务。具体数据集可以在官网链接上找到,由Ronny Kohavi and Barry Becker捐赠。该数据集包含48842个实例,包括continuous、discrete ,如果去掉unknown values,共计45222实例。其中有6个样本是重复或冲突的实例,官网。.........原创 2020-12-21 23:34:30 · 5792 阅读 · 0 评论 -
Dataset:heart disease心脏病数据集的简介、下载、使用方法之详细攻略
根据美国CDC(疾病预防控制中心)的说法,心脏病是美国大多数种族(非裔美国人、美国印第安人、阿拉斯加原住民和白人)死亡的主要原因之一。大约一半的美国人(47%)至少有三种主要的心脏病风险因素中的一种:高血压、高胆固醇和吸烟。其他关键指标包括糖尿病、肥胖(BMI高)、没有进行足够的体育活动或饮酒过量。检测和预防对心脏病影响最大的因素在医疗保健中非常重要。反过来,计算技术的发展使得机器学习方法的应用能够从数据中检测出“模式”,从而预测患者的病情,同时指出哪些变量对心脏病的可能性有显著影响。...原创 2022-08-05 23:11:29 · 9718 阅读 · 1 评论 -
Dataset:titanic泰坦尼克号数据集/泰坦尼克数据集(是否获救二分类预测)的简介、下载、案例应用之详细攻略
Dataset:titanic泰坦尼克号数据集/泰坦尼克数据集(是否获救二分类预测)的简介、下载、案例应用之详细攻略目录titanic(泰坦尼克号)数据集的简介titanic(泰坦尼克号)数据集的下载titanic(泰坦尼克号)数据集的案例应用titanic(泰坦尼克号)数据集的简介 泰坦尼克号沉船事故。1912年,当时隶属于英国的世界级豪华客轮泰坦尼克号,因在处女航行中不幸撞上北大西洋冰山而沉没。这场事故使得1500多名乘客罹难。后来,这场震惊世界的惨剧原创 2019-07-22 07:48:25 · 8377 阅读 · 1 评论 -
Dataset之mpg:mpg汽车油耗数据集的简介、下载、使用方法之详细攻略
1983年美国统计协会博览会使用了该数据集。这个数据集是对StatLib库中提供的数据集稍加修改的版本。根据RossQuinlan(1993)在预测属性“mpg”中的使用,删除了8个原始实例,因为它们的“mpg”属性值未知。原始数据集在“auto-mpg.data-original”文件中。该数据集共计9个特征,398个样本,用于回归任务。“该数据涉及城市周期燃料消耗(单位为每加仑英里),将根据3个多值离散和5个连续属性进行预测。Dataset之mpgmpg数据集的简介、下载、使用方法之详细攻略。.....原创 2022-08-01 01:22:31 · 4668 阅读 · 0 评论 -
Dataset:New York City Taxi Fare Prediction纽约市出租车票价预测数据集的简介、下载、使用方法之详细攻略
NewYorkCityTaxiFarePrediction,纽约市出租车票价预测,该数据集包括共计8个字段,分别是key,fareamount,pickupdatetime,pickuplongitude,pickuplatitude,dropofflongitude,dropofflatitude,passengercount,即键,票价金额,接送日期时间,接送经度,接送纬度,下车经度,下车纬度,乘客数量。......原创 2022-07-28 23:32:42 · 1912 阅读 · 0 评论 -
Dataset:Medical Data and Hospital Readmissions医疗数据和医院再入院情况数据集的简介、下载、使用方法之详细攻略
MedicalDataandHospitalReadmissions,医疗数据和医院再入院情况,该数据集包括共计65个字段,分别是住院时间,实验室操作数,操作数,药物操作数,门诊操作数,急诊操作数,住院操作数,诊断操作数,种族白人,种族非洲裔,性别女性,年龄[70-80],年龄[60-70),年龄[50-60),年龄[80-90),年龄[40-50],支付码?,支付码MC,支付码HM,支付码SP,支付码BC,医学专科?......原创 2022-07-28 23:04:56 · 1953 阅读 · 0 评论 -
Dataset:FIFA 2018 Statistics数据集(Predict FIFA 2018 Man of the Match预测2018年国际足联最佳球员)的简介、下载、使用方法之详细攻略
FIFA2018Statistics数据集是包含2018男足世界杯(128场比赛)基本统计信息,此文件包含FIFA2018比赛统计数据,被用来预测2018年国际足联最佳球员,PredictFIFA2018ManoftheMatch。字段包括日期、球队、对手、进球数、控球率、尝试次数、正中、偏离目标、封堵、角球、越位、任意球、扑救、传球准确率%、传球、覆盖距离(公里)、犯规次数、黄牌、黄色和红色、红色、最佳球员、第一个进球、回合、PSO、PSO进球、乌龙球、乌龙球时间,共计27个字段组成。......原创 2022-07-28 22:33:51 · 2344 阅读 · 0 评论 -
Dataset:White Wine Quality白葡萄酒品质数据集的简介、下载、使用方法之详细攻略
等级是有序的并且不平衡(例如,普通葡萄酒比优质或劣质葡萄酒多得多)。异常值检测算法可用于检测少数优秀或劣质的葡萄酒。由于隐私和逻辑问题,只有物理化学(输入)和感官(输出)变量可用(例如,没有关于葡萄类型、葡萄酒品牌、葡萄酒售价等的数据)。WhiteWineQuality白葡萄酒品质数据集,经常被用于回归或分类建模的简单而干净的练习数据集。DatasetWhiteWineQuality白葡萄酒品质数据集的简介、下载、使用方法之详细攻略。质量(得分在0到10之间),输出变量(基于感官数据)......原创 2022-07-15 17:44:24 · 3179 阅读 · 1 评论 -
Dataset之babyboom.dat:babyboom.dat数据集的简介、安装、使用方法之详细攻略
Dataset之babyboom.dat:babyboom.dat数据集的简介、安装、使用方法之详细攻略目录babyboom.dat数据集的简介、安装、使用方法babyboom.dat数据集的简介babyboom.dat数据集的安装babyboom.dat数据集的使用方法babyboom.dat数据集的简介、安装、使用方法babyboom.dat数据集的简介 Forty-four babies -- a new record -- were bo...原创 2021-02-24 21:56:58 · 2215 阅读 · 0 评论 -
Dataset:Big Mart Sales数据集的简介、下载、案例应用之详细攻略
Dataset:Big Mart Sales数据集的简介、下载、案例应用之详细攻略目录Big Mart Sales数据集的简介1、特征解释Big Mart Sales数据集的下载Big Mart Sales数据集的案例应用1、基础案例Big Mart Sales数据集的简介 BigMart的数据科学家收集了不同城市10家商店1559种产品,这是2013年的销售数据。其目的是建立一个预测模型,并找出每种产品在特定商店的销售情...原创 2020-12-17 22:08:09 · 4001 阅读 · 0 评论 -
Dataset:fetch_20newsgroups(20类新闻文本)数据集的简介、安装、使用方法之详细攻略
20 newsgroups数据集18000多篇新闻文章,一共涉及到20种话题,所以称作20newsgroups text dataset,分为两部分:训练集和测试集,通常用来做文本分类,均匀分为20个不同主题的新闻组集合。20newsgroups数据集是被用于文本分类、文本挖据和信息检索研究的国际标准数据集之一。原创 2020-08-28 20:05:18 · 20577 阅读 · 1 评论 -
Dataset之Knifey-Spoony:Knifey-Spoony数据集的简介、下载、使用方法之详细攻略
Dataset之Knifey-Spoony:Knifey-Spoony数据集的简介、下载、使用方法之详细攻略目录Knifey-Spoony数据集的简介##The Knifey-Spoony Data-Set## Introduction## ImagesKnifey-Spoony数据集的下载Knifey-Spoony数据集的使用方法...原创 2019-08-03 16:49:35 · 4700 阅读 · 0 评论 -
Dataset之JFT:JFT/FastEval14k数据集的简介、下载、案例应用之详细攻略
Dataset之JFT:JFT数据集的简介、下载、案例应用之详细攻略目录JFT/FastEval14k数据集的简介JFT数据集的下载JFT数据集的案例应用JFT/FastEval14k数据集的简介 JFT是用于大规模图像分类数据集的内部Google数据集。它包含超过3.5亿个高分辨率图像,并用17,000个类别中的标签注...原创 2019-08-02 08:40:28 · 7996 阅读 · 3 评论 -
Dataset之WebVision:WebVision数据集简介、下载、使用方法之详细攻略
Dataset之WebVision:WebVision数据集简介、下载、使用方法之详细攻略目录WebVision数据集简介1、WebVision数据集挑战WebVision数据集下载WebVision数据集使用方法WebVision数据集简介 WebVision数据集主要有Google和Flickr两个数据源。...原创 2019-05-22 23:33:45 · 8150 阅读 · 1 评论 -
Dataset之Fashion-MNIST:Fashion-MNIST数据集简介、下载、使用方法之详细攻略
Dataset之Fashion-MNIST:Fashion-MNIST数据集简介、下载、使用方法之详细攻略目录Fashion-MNIST数据集简介1、Why we made Fashion-MNISTFashion-MNIST数据集下载0、数据集及代码下载1、基于python语言下载2、基于Tensorflow下载Fashion-MNIST数据集使用方...原创 2019-05-22 23:33:17 · 13497 阅读 · 2 评论 -
Dataset之ImageNet:ImageNet数据集简介、下载、使用方法之详细攻略
Dataset之ImageNet:ImageNet数据集简介、下载、使用方法之详细攻略目录lmageNet 数据集简介1、ImageNet数据集的意义2、ImageNet的数据结构——层次结构及其1000个类别3、ImageNet数据集与ILSVRC竞赛的关系4、与CIFAR-10数据集比较5、相关论文lmageNet 数据集安装lmag...原创 2018-09-21 12:22:29 · 75071 阅读 · 8 评论 -
Dataset之BDD100K:BDD100K数据集的简介、下载、使用方法之详细攻略
Dataset之BDD100K:BDD100K数据集的简介、下载、使用方法之详细攻略目录BDD100K数据集的简介BDD100K数据集的下载BDD100K数据集的使用方法BDD100K数据集的简介 BDD100K,A Large-scale Diverse Driving Video Database。2018...原创 2019-08-29 21:07:43 · 21175 阅读 · 34 评论 -
Dataset之CamVid:CamVid数据集的简介、下载、使用方法之详细攻略
Dataset之CamVid:CamVid数据集的简介、下载、使用方法之详细攻略目录CamVid数据集的简介CamVid数据集的下载CamVid数据集的使用方法CamVid数据集的简介 Cambridge-driving Labeled Video Database (CamVid)。CamVid是第一...原创 2019-08-29 21:17:55 · 30238 阅读 · 9 评论 -
Dataset之MapillaryVistas:MapillaryVistas数据集的简介、下载、使用方法之详细攻略
Dataset之MapillaryVistas:MapillaryVistas数据集的简介、下载、使用方法之详细攻略目录MapillaryVistas数据集的简介1、数据集特点MapillaryVistas数据集的下载MapillaryVistas数据集的使用方法MapillaryVistas数据集的简介 ...原创 2019-08-29 21:33:34 · 13444 阅读 · 12 评论 -
Dataset之ApolloScape :ApolloScape Scene Parsing数据集的简介、下载、使用方法之详细攻略
Dataset之ApolloScape :ApolloScape Scene Parsing数据集的简介、下载、使用方法之详细攻略ApolloScape数据集的简介 Apolloscape数据集,用于自动驾驶的Apolloscape高级开放工具和数据集,是阿波罗自主驾驶项目的一部分,是一个面向研究的项目,旨在促进自主驾驶从感知、导航到控制的各个方...原创 2019-08-29 21:42:01 · 11090 阅读 · 3 评论 -
Dataset之ADE20k:ADE20k数据集的简介、安装、使用方法之详细攻略
Dataset之ADE20k:ADE20k数据集的简介、安装、使用方法之详细攻略目录ADE20k数据集的简介1、数据集组成2、图片和注释3、每幅图像下的文件ADE20k数据集的安装ADE20k数据集的使用方法ADE20k数据集的简介 ADE20k拥有超过25,000张图像(20ktrain,2k val,3...原创 2019-09-03 09:46:22 · 43332 阅读 · 1 评论 -
Dataset之IRIS:鸢尾花(Iris)数据集的简介、下载、使用方法之详细攻略
Dataset之IRIS:鸢尾花(Iris)数据集的简介、下载、使用方法之详细攻略目录莺尾花(Iris)数据集的简介莺尾花(Iris)数据集的下载莺尾花(Iris)数据集的使用方法莺尾花(Iris)数据集的简介 Iris数据集,也称鸢尾花数据集,是一类多重变量分析的数据集,于1988年公开,用于分类任务。数据集包含150个数据集,分为3类,每类50个数据,每个数据包含4个属性。可通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versi原创 2018-02-25 15:47:07 · 20887 阅读 · 1 评论 -
Dataset之MNIST:MNIST(手写数字图片识别+ubyte.gz文件)数据集的下载(基于python语言根据爬虫技术自动下载MNIST数据集)
Dataset之MNIST:MNIST(手写数字图片识别+ubyte.gz文件)数据集的下载(基于python语言根据爬虫技术自动下载MNIST数据集)目录数据集下载的所有代码1、主文件mnist_download_main.py文件2、mnist.py文件3、dataset.py文件4、cache.py5、download.py文件...原创 2018-09-01 15:49:28 · 14867 阅读 · 0 评论 -
Dataset之DA:数据增强(Data Augmentation)的简介、方法、案例应用之详细攻略
Dataset之DA:数据增强(Data Augmentation)的简介、方法、案例应用之详细攻略目录DA的简介DA的方法DA的案例应用DA的简介 数据集增强主要是为了减少网络的过拟合现象,通过对训练图片进行变换可以得到泛化能力更强的网络,更好的适应应用场景。1、数据增强常用的方法—特殊四法之...原创 2019-06-25 16:27:38 · 9289 阅读 · 1 评论 -
Dataset之iGAN:iGAN数据集的简介、安装、使用方法之详细攻略
Dataset之iGAN:iGAN数据集的简介、安装、使用方法之详细攻略目录iGAN数据集的简介iGAN数据集的安装iGAN数据集的使用方法iGAN数据集的简介iGAN项目中的13万张图片。大小为8.6GBiGAN数据集的安装更新……图片文件丢失iGAN数据集的使用方法更新……图片文件丢失...原创 2018-10-07 20:22:49 · 7787 阅读 · 0 评论 -
Dataset之UT Zappos50K:UT Zappos50K数据集的简介、安装、使用方法之详细攻略
Dataset之UT Zappos50K:UT Zappos50K数据集的简介、安装、使用方法之详细攻略目录UT Zappos50K数据集的简介UT Zappos50K数据集的安装UT Zappos50K数据集的使用方法UT Zappos50K数据集的简介UT Zappos50K中的5万张图片。大小为2.2GBUT Zappos...原创 2018-10-07 20:21:48 · 9402 阅读 · 0 评论 -
Dataset之谷歌地图数据集:谷歌地图数据集的简介、安装、使用方法之详细攻略
Dataset之谷歌地图数据集:谷歌地图数据集的简介、安装、使用方法之详细攻略目录谷歌地图数据集的简介谷歌地图数据集的安装谷歌地图数据集的使用方法谷歌地图数据集的简介 谷歌地图中的1000多张图片。包含了卫星图像和对应的地图,大小为246MB。谷歌地图数据集的安装百度云盘文件已丢失……国外地址链接:https:...原创 2018-10-07 20:20:39 · 10937 阅读 · 2 评论 -
Dataset之Cityscapes:Cityscapes数据集的简介、安装、使用方法之详细攻略
Dataset之Cityscapes:Cityscapes数据集的简介、安装、使用方法之详细攻略目录Cityscapes数据集的简介1、Cityscapes数据集的特点2、Cityscapes数据集的目的3、样例解释4、Features5、标签政策6、Class DefinitionsCityscapes数据集的安装Cityscapes数据...原创 2018-10-07 20:18:44 · 78611 阅读 · 25 评论 -
Dataset之Facades:Facades数据集的简介、安装、使用方法之详细攻略
Dataset之Facades:Facades数据集的简介、安装、使用方法之详细攻略目录Facades数据集的简介Facades数据集的安装Facades数据集的使用方法Facades数据集的简介 提出了组装在机器感知中心的外观图像的数据集,包括来自各种来源的606幅经过校正的图像,这些图像已经被手动注释。立面是来自世界各地的城市和不同的...原创 2018-10-07 16:12:09 · 16701 阅读 · 6 评论 -
Dataset之LSUN:LSUN数据集的简介、安装、使用方法之详细攻略
Dataset之LSUN:LSUN数据集的简介、安装、使用方法之详细攻略目录LSUN数据集的简介1、Paper2、简介3、LSUN数据集上DCGAN的生成结果LSUN数据集的安装LSUN数据集的使用方法LSUN数据集的简介1、PaperFisher Yu, Ari Seff, Yinda Zhang, Shuran Song, ...原创 2018-10-05 19:22:56 · 29268 阅读 · 68 评论 -
Dataset之COCO数据集:COCO数据集的简介、下载、使用方法之详细攻略
Dataset之COCO数据集:COCO数据集的简介、安装、使用方法之详细攻略目录COCO数据集的简介0、COCO数据集的80个类别—YoloV3算法采用的数据集1、COCO数据集的意义2、COCO数据集的特点3、数据集的大小和版本COCO数据集的下载1、2014年数据集的下载2、2017的数据集的下载COCO数据集的使用方法1、基础用...原创 2018-10-04 19:52:43 · 315147 阅读 · 26 评论 -
Dataset之CV:人工智能领域数据集集合(计算机视觉CV方向数据集)之常见的计算机视觉图像数据集大集合(包括表面缺陷检测数据集,持续更新)
Dataset之CV:人工智能领域数据集集合(计算机视觉CV方向数据集)之常见的计算机视觉图像数据集大集合(包括表面缺陷检测数据集,持续更新)原创 2018-10-02 22:23:21 · 12705 阅读 · 2 评论 -
Dataset之图片数据增强:基于TF实现图片数据增强(原始的训练图片reshaped_image→数据增强→distorted_image(训练时直接使用))
Dataset之图片数据增强:基于TF实现图片数据增强(原始的训练图片reshaped_image→数据增强→distorted_image(训练时直接使用))目录数据增强步骤数据增强实现代码数据增强步骤1、对reshaped_image随机裁剪图片:从原始32×32裁剪到24×24小块进行训练,因为小块可以取在图像的任何位置,所以仅此一步就可以大...原创 2018-09-20 22:40:33 · 12813 阅读 · 1 评论 -
Dataset之CASIA-WebFace:CASIA-WebFace 数据集的简介、安装、使用方法之详细攻略
Dataset之CASIA-WebFace:CASIA-WebFace 数据集的简介、安装、使用方法之详细攻略目录CASIA-WebFace 数据集的简介1、英文原文介绍CASIA-WebFace 数据集的安装CASIA-WebFace 数据集的使用方法1、基础用法CASIA-WebFace 数据集的简介 ...原创 2018-10-02 14:30:22 · 37122 阅读 · 92 评论