Tips:
本期向大家分享利用WebPlotDigitizer提取图像中的数值数据的方法,这个平台是完全免费的,我会附上两个网址,两者区别不大:
第一个是官方版网址,需要科学上网的手段 (https://automeris.io/)
第二个是有网就可以访问的网址(https://apps.automeris.io/wpd4/)
由于官方版网址进入之后需要注册登录,稍加麻烦,所以我会以官方版为例进行步骤演示,具体的注册步骤这里不做说明,按着官方的指引进行注册就好了。下面开始进行步骤演示。
① 如果已注册了账号,那么点击红色框选按钮进行登录;如果没有注册账号,那么仍然点击红色框选按钮,按照指引进行进行注册,对于注册邮箱并无严格要求,比如我用的163邮箱就可以注册。
② 在登录帐号之后,会弹出下面这个界面,让用户加载图片文件。
③ 在添加了图片文件之后,会弹出坐标轴类型的选项,最常规的是第一个选项:二维的XY轴。点击Calibrate进行后续校准。
④ 在选择了坐标轴类型之后,鼠标处出现十字星标,按顺序在X和Y轴各选择两个点(X1、X2和Y1、Y2),在右侧栏输入相应的数值。此外,在右侧栏还能选择线性坐标或对数坐标。点击Calibrate完成校准。
⑤ 在校准了坐标轴之后,右侧栏会出现下图的信息,上半部分是手动提取Manual Extraction功能区,下半部分是自动提取Automatic Extraction功能区。我们一般先使用自动提取获取大量数据点,然后再使用手动提取对数据点进行局部调整。在使用自动提取时,首先需要进行前置色和背景色的设置,比如案例中要提取的水电站机组特性曲线是黑色的,背景是白色的,那么前置色Foreground需要设置为黑色,背景色Background需要设置为白色。设置颜色可以通过设置RGB的具体值来实现,也可以直接在自动识别的主要颜色Dominant Colors中进行选择。
⑥ 在设置好颜色之后,为了追求更精确的提取数据点,一般选择画笔Pen而不是矩形框Box。设置好合适的线宽Width,就可以沿着继续曲线进行描绘了。
⑦ 如果不小心描绘到了机组曲线范围以外,可以用橡皮Erase擦除失误的部分。
⑧ 在描绘曲线之后,可以通过修改右侧栏中Distance和xy的取值像素大小来进一步调整数据点的数量和准确度。我理解的是:Distance值越大,运行Run之后的数据点越多,但是提取的点的范围会变大,会出现偏差过大的点;Distance值越小,运行Run之后的数据点越少,但是提取点的范围会变小,提取的点偏差小,更准确。xy的取值像素大小越小,运行Run之后的数据点越多;xy的取值像素大小越大,运行Run之后的数据点越少。在调整好这些参数之后,运行点击Run,就会出来一批数据点。
⑨ 如果发现描绘的部分需要补充数据点,或是有个别几个偏差较大的点,这个时候用手动提取Manual Extraction进行局部调整,Add Point可以单个手动添加数据点,Adjust Point可以通过更改单个数据点的坐标,对偏差较小的数据点进行细微的调节,Delete Point可以直接删除偏差过大的数据点。
手动提取操作示意视频
⑩ 完成数据点的局部调整之后,点击左侧栏的查看数据View Data,可以看到所有数据点对于的值,并支持导出下载为相应的格式,方便后续的应用。
⑪ 此外,点击Graph in Plotly*还能够查看这些数据点对应的图像。
本篇博客旨在帮助大家使用WebPlotDigitizer从论文图像中提取数值数据,分享了相关的操作步骤,看着步骤琐碎,其实操作起来非常顺利,最后的数据提取效果也相当不错。
以上是全部内容,欢迎大家评论区留言,批评指正。