R语言【gatoRs】——gators_download：从iDigBio和GBIF下载数据

最新推荐文章于 2024-08-12 18:13:32 发布

ALittleHigh

最新推荐文章于 2024-08-12 18:13:32 发布

阅读量700

点赞数 8

分类专栏： R语言文章标签： r语言 python 服务器

本文链接：https://blog.csdn.net/whitedrogen/article/details/137077820

版权

R语言专栏收录该内容

88 篇文章 5 订阅

订阅专栏

Package gatoRs version 1.0.1

Description

gators_download()函数从GBIF和iDigBio下载所需物种的数据。

Usage

gators_download(
  synonyms.list,
  write.file = FALSE,
  filename = NA,
  gbif.match = "fuzzy",
  gbif.prov = FALSE,
  idigbio.filter = TRUE,
  limit = 1e+05
)

Arguments

参数【synonyms.list】：科学名称列表，包括公认的科学名称和您想要的物种的任何同义词。例如，synonyms.list = c("Asclepias curtissii","Asclepias aceratoides", "Asclepias arenicola", "Oxypteryx arenicola", "Oxypteryx curtissii")。必选参数。

参数【write.file】：用于选择是否生成包含搜索结果的.csv文件的参数。该参数不是必需的，默认为FALSE。

参数【filename】：检索数据的路径和文件名。注意，该参数还应包括“.csv”扩展名。例如，filename = "base_folder/other_folder/my_file.csv"。文件路径可以输入相对于当前工作目录的路径(例如:"../my_file.csv")，也可以输入完整路径。当write.file=TRUE时，此参数必须。

参数【gbif.match】：一个参数，可以选择用模糊匹配的学名进行搜索，也可以用物种代码进行搜索。例如，gbif.match = "fuzzy"将按模糊匹配和gbif.match = "code"将按代码进行搜索。该参数不需要设置，默认为“fuzzy”。

参数【gbif.prov】：从GBIF获取提供程序/逐字列的参数。该参数为可选参数，默认值为FALSE。

参数【idigbio.filter】：从iDigBio中删除不太相关的搜索结果的参数。根据搜索输入，结果可能包括不同物种的数据点，例如，这些数据点在位置信息中提到所需的物种。选择idigbio.filter = TRUE将返回包含名称列fuzzy与同义词列表中的名称匹配的行的数据帧。该参数不是必需的，默认为TRUE。

参数【limit】：默认为100000（最大值）。设置对同义词中每个元素请求的记录数的限制。来自每个聚合器的列表。

Details

使用gators_download()，您可以从GBIF和iDigBio获取您感兴趣的物种的生物多样性记录。

该功能在搜索iDigBio的方式上具有创新性。

与spocc::occ()不同，我们不使用学名字段查询iDigBio API，因为这只会返回精确匹配。

相反，我们设计了一个“伪模糊匹配”来搜索所有字段中与提供的科学名称部分匹配的字段。

该函数使用get_idigbio()、get_gbif()、fix_columns()、fix_names()和filter_fix_names()函数。

本函数依赖magrittr、rgbif、dplyr、ridigbio和stringr包。

Value

返回一个数据帧，并按照输入中指定的方式写入csv文件。这个csv文件将包含从GBIF和iDigBio数据库中搜索所需物种的结果。列名如下：

scientificName
genus
specificEpithet
infraspecificEpithet
ID
occurrenceID
basisOfRecord
eventDate
year
month
day
institutionCode
recordedBy
informationWithheld
country
county
stateProvince
locality
latitude
longitude
coordinateUncertaintyInMeters
habitat
aggregator

Example

df <- gators_download(synonyms.list = c("Galax urceolata", "Galax aphylla"), limit = 10)

df <- gators_download(synonyms.list = "Galax urceolata", gbif.match = "code",
idigbio.filter = FALSE, limit = 10)

ALittleHigh

关注

8
点赞
踩
12

收藏

觉得还不错? 一键收藏
打赏
0
评论
R语言【gatoRs】——gators_download：从iDigBio和GBIF下载数据

gators_download()函数从GBIF和iDigBio下载所需物种的数据。Arguments参数【synonyms.list】：科学名称列表，包括公认的科学名称和您想要的物种的任何同义词。例如，synonyms.list = c("Asclepias curtissii","Asclepias aceratoides", "Asclepias arenicola", "Oxypteryx arenicola", "Oxypteryx curtissii")。必选参数。参数【write.f
复制链接

扫一扫