Package gatoRs version 1.0.1
Description
gators_download()函数从GBIF和iDigBio下载所需物种的数据。
Usage
gators_download(
synonyms.list,
write.file = FALSE,
filename = NA,
gbif.match = "fuzzy",
gbif.prov = FALSE,
idigbio.filter = TRUE,
limit = 1e+05
)
Arguments
参数【synonyms.list】:科学名称列表,包括公认的科学名称和您想要的物种的任何同义词。例如,synonyms.list = c("Asclepias curtissii","Asclepias aceratoides", "Asclepias arenicola", "Oxypteryx arenicola", "Oxypteryx curtissii")。必选参数。
参数【write.file】:用于选择是否生成包含搜索结果的.csv文件的参数。该参数不是必需的,默认为FALSE。
参数【filename】:检索数据的路径和文件名。注意,该参数还应包括“.csv”扩展名。例如,filename = "base_folder/other_folder/my_file.csv"。文件路径可以输入相对于当前工作目录的路径(例如:"../my_file.csv"),也可以输入完整路径。当write.file=TRUE时,此参数必须。
参数【gbif.match】:一个参数,可以选择用模糊匹配的学名进行搜索,也可以用物种代码进行搜索。例如,gbif.match = "fuzzy"将按模糊匹配和gbif.match = "code"将按代码进行搜索。该参数不需要设置,默认为“fuzzy”。
参数【gbif.prov】:从GBIF获取提供程序/逐字列的参数。该参数为可选参数,默认值为FALSE。
参数【idigbio.filter】:从iDigBio中删除不太相关的搜索结果的参数。根据搜索输入,结果可能包括不同物种的数据点,例如,这些数据点在位置信息中提到所需的物种。选择idigbio.filter = TRUE将返回包含名称列fuzzy与同义词列表中的名称匹配的行的数据帧。该参数不是必需的,默认为TRUE。
参数【limit】:默认为100000(最大值)。设置对同义词中每个元素请求的记录数的限制。来自每个聚合器的列表。
Details
使用gators_download(),您可以从GBIF和iDigBio获取您感兴趣的物种的生物多样性记录。
该功能在搜索iDigBio的方式上具有创新性。
与spocc::occ()不同,我们不使用学名字段查询iDigBio API,因为这只会返回精确匹配。
相反,我们设计了一个“伪模糊匹配”来搜索所有字段中与提供的科学名称部分匹配的字段。
该函数使用get_idigbio()、get_gbif()、fix_columns()、fix_names()和filter_fix_names()函数。
本函数依赖magrittr、rgbif、dplyr、ridigbio和stringr包。
Value
返回一个数据帧,并按照输入中指定的方式写入csv文件。这个csv文件将包含从GBIF和iDigBio数据库中搜索所需物种的结果。列名如下:
- scientificName
- genus
- specificEpithet
- infraspecificEpithet
- ID
- occurrenceID
- basisOfRecord
- eventDate
- year
- month
- day
- institutionCode
- recordedBy
- informationWithheld
- country
- county
- stateProvince
- locality
- latitude
- longitude
- coordinateUncertaintyInMeters
- habitat
- aggregator
Example
df <- gators_download(synonyms.list = c("Galax urceolata", "Galax aphylla"), limit = 10)
df <- gators_download(synonyms.list = "Galax urceolata", gbif.match = "code",
idigbio.filter = FALSE, limit = 10)