1.概述
ODV可以导入新的数据并将导入的数据添加到现有的数据集中,或者将数据添加到自动创建的新数据集中。它支持多种数据文件格式,包括许多常见的海洋学数据格式和各种面向列的电子表格文件。数据导入可以一次完成一个文件,也可以一次处理可能大量的导入文件。可以通过文件选择对话框或通过在单独的文件中提供文件名列表来手动选择导入文件。使用内置列表文件生成器可以轻松生成文件列表。您可以指定导入文件(zip、gz或tar.gz)的存档,软件将自动执行解压。导入数据时分为两种情况:(1)在导入数据时打开已有的数据集(2)在导入数据时未打开数据集。
1.1导入数据时打开已有数据集
如果在启动导入时打开集合,ODV将分析所有选定的导入文件,并构造文件中包含的变量的超集(源变量)。然后显示对话框,允许用户将导入文件中的元数据和数据变量与当前打开的集合的变量(目标变量)关联。接着,ODV将所有导入文件中的数据导入到当前打开的集合中。
1.2导入数据时未打开数据集
如果导入数据时没有打开数据集,则ODV将分析所有选定的导入文件,并构造包含在文件中的元变量和数据变量的子集合。然后ODV自动创建一个或多个合适的目标数据集来接收导入的数据。目标数据集包含在分析期间在导入文件中找到的变量集。源变量和目标变量之间的关联是自动建立的,导入过程无需用户进一步干预。
带有自动创建的目标集合的数据导入(类型2;启动导入时没有打开的数据集)实际导入的是导入文件中找到的所有元变量和数据变量的所有数据。当主要关注导入数据的完整性时,这应该是首选的导入类型。导入现有的数据集(类型1;当启动导入时,数据集是打开的)应该只在主要关注的是用新数据扩展现有数据集时才使用。注意,在该导入类型中,导入的文件中不包含现有数据集中的变量的元数据或数据将不被导入。
2.ODV导入数据的方式
2.1Import菜单
这是导入的常规方式。从“Import”菜单中选择适当的条目,然后选择要导入的文件。导入到打开的数据集时,可能会禁用某些导入程序,以防止导入不兼容的数据。例如,不能将时间序列数据导入包含配置文件数据的数据集。
2.2File > Open 选项
File > Open 选项是导入单个电子表格文件导入的便捷方式。显示“Open”对话框后,将类型筛选器切换到数据文件并选择电子表格文件。
2.3拖放
有些导入程序只需在文件浏览器中选择一个或多个文件并将这些文件放到ODV窗口中,就可以导入数据。ODV根据第一个拖入的文件的文件类型选择适当的导入器。对于未知的文件类型,默认使用ODV电子表格导入。
2.4命令文件
一些导入程序可以通过调用ODV命令文件以批处理模式运行。
多文件导入:所有导入程序允许每次导入多个文件。可以通过文件选择对话框、多文件拖放或在单独的文件中提供文件名列表来手动选择导入文件。您可以使用内置的列表文件生成器轻松地生成文件列表。如果要从多个目录中导入多个文件,或者简单地说,如果计划重复导入,并且不想重复手动选择大量文件,则此选项非常有用。
文件特定变量:所有导入程序通过分析导入文件并收集文件中找到的变量超集,自动构建导入元变量和数据变量的列表。类型2导入(导入时没有打开的数据集)自动创建合适的目标数据集,接收导入文件中所有变量的导入数据。
3.从ODV电子表格文件导入数据
ODV可以从各种电子表格类型的文件中读取和导入数据。如果导入文件的格式与ODV通用电子表格格式兼容,则数据导入将是完全自动的,不需要用户操作。 可以使用菜单选项Import>ODV Spreadsheet 和 File>Open打开和导入电子表格文件,或者只需将导入文件放在ODV窗口或图标上。ODV也可以导入不兼容的电子表格数据文件。
可以导入包含或不包含站位元数据信息以及包含或不包含列标签的电子表格文件。ODV电子表格文件可以包含注释、列分隔符、制表符或分号。丢失的数据可以用特殊的数字或文本指示器或空数据字段来表示。电子表格文件可能包含来自一个或多个航次的多个站位的数据。每个站位可包含有限数量的样本(每个样本一行)。一个站位的样本必须是连续的,但不一定要排序。
在读取电子表格文件时,只要Cruise、Station、Type中的一个或多个条目变化,ODV将数据分为不同站位,并且LOCAL_CDI_ID从一行更改到下一行。如果日期/时间、经度和/或纬度的变化超过某些指定的公差,即使Cruise、Station、Type保持不变,也会改变站位。 默认公差值为1小时和0.1度经度或纬度。这些值可以通过View > Settings > Spreadsheet Import 选项修改。
如果数据文件中未提供站位信息,则会检查日期、时间、经度和纬度值,并且只要其中一个或多个值发生更改,就会发生站位中断。站位的所有元数据(如日期/时间、经度和纬度)都取自导入文件中站位的第一个样本。
从文件导入的数据将添加到当前打开的数据集中,如果当前没有打开的集合,则将添加到适当的新创建的数据集中。要将数据从电子表格文件导入当前打开的集合,选择“ Import > ODV Spreadsheet”,然后使用“标准文件选择”对话框标识数据文件。指定导入选项并按“确定”开始数据导入。电子表格文件也可以拖放到ODV图标或打开的ODV窗口中。
4.关联元变量对话框(Meta-variables)
导入数据时,ODV会尝试在导入文件中自动定位必需的元数据,如航次和站位名称、观测日期以及经纬度。如果该元变量的自动关联不成功,并且导入到现有集合(导入类型1),会出现关联元变量对话框(请参见图4-2),要求用户手动识别元数据的来源。
如果要定义新关联,在“Source Variables(源变量)”和“Meta Variables(元变量)”列表中选择项,然后按“Associate”。要在导入期间调用转换函数,请按“Convert”并选择一个可用的转换算法。若要删除现有关联,请选择相应的变量并按撤消操作。如果导入文件不包含给定元变量的信息,则可以按如下方式指定默认值:(1)选择相应的元变量;(2)按SET Default键;(3)输入默认值。注意,指定的默认设置用于文件中的所有数据行。完成后按“OK”或者按“Cancel” 中止导入过程。
要注意的是,必须将经度和纬度元变量关联起来(没有给定的地理位置,ODV无法处理站位),否则OK按钮将保持禁用状态。注意复合源变量的关联或转换,如ISO8601日期和时间规范YYYY-MM-DDTHH:MM:SS:SSS将自动连接多个目标元变量(例如,年、月、日等)。
5.导入选项对话框(Import Options )
当将数据导入到现有集合(导入类型1)时,ODV将呈现一个导入选项对话框,该对话框允许你将导入文件中的源数据变量与目标集合中的数据变量连接起来。还可以选择导入模式并指定用于检查在目标集合中是否已经存在正在导入的站位所需的参数(参见图4-3)。
导入模式:
- Add/Replace Station Data添加/替换站位数据:如果要将导入文件中的数据添加到数据集中,请选择此选项。如果勾选了“Check for existing stations”复选框,ODV通过应用用户指定的标准搜索目标集合以寻找匹配的站位,如果发现,请求允许用导入文件中的新数据替换目标集合中的现有站位。
- Merge Data (selected variables)合并数据(选定变量):如果要为一个或多个变量(合并变量)添加数据,并保留其他变量的现有数据不变,请选择此选项。 合并变量在给定样本中的合并值取决于表4-2中所示的现有数据和新数据值。 要注意的是,在该模式无法取消“Check for existing stations”复选框。在添加数据之前,ODV在数据集中搜索匹配的站位,如果找到,则从集合中读取原始站位,添加选定变量的数据,并用更新的版本替换原始站位。如果找不到匹配的站位,则会通知用户。对于合并数据(选定变量)导入,必须确保目标集合的主变量与源变量之一关联。这一关联对于正确识别接收导入数据的样本是必要的。如果主变量没有关联,“Import Options(导入选项)”对话框上的“确定”按钮(见图4-3)将被禁用。使用选项collection>properties>general确定集合的主变量。
- Update Data (selected variables)更新数据(选定变量):如果要更新一个或多个变量(更新变量)的数据,并保留其他变量的现有数据不变,请选择此选项。在给定样本中更新变量的更新值仅取决于新的数据值,并且丢弃现有值。要注意的是,在该模式无法取消“Check for existing stations”复选框。更新数据之前,ODV在数据集中搜索匹配的站位,如果找到,则从数据集中读取原始站位,更新选定变量的数据,并用更新的版本替换原始站位。如果找不到匹配的站位,则会通知用户。