2020.7.13 筛选tagged后的语料excel中的动名词搭配
本文仅作为个人语料处理日志,若有错误请各位看官轻喷。欢迎交流o( ̄▽ ̄)ブ
原本想对tagged后的所有exel文件利用python进行批量处理、高亮动词字段,但是转念一想,反正都需要人工阅读,才能准确找到该动词对应/支配的名词,那就边读便手动高亮算了。
1. 高亮动词
也就是非常白痴的操作,筛选-排序,高亮所有的Verb;
清楚筛选条件之后就得到正常的、可读排列顺序了:
2. 阅读文本,并对动名词搭配进行分类
大概的思路为:
另外为了便于阅读,还加上了该动名词搭配所在的原文、梳理后(删去各种修饰词,只留主干部分)的文本结构、动词原形和句式(主动or被动)。
因此最终得到的一串字段为:
原文
梳理后
Genus 主动/被