CALLFRIEND Vietnamese汇聚了60个自然、未经预设的电话交谈记录,每个交谈的时长在5分钟到30分钟不等,累计总时长达到了大约25小时。除了这些交谈内容,语料库还附带了详尽的文档,用以描述参与者的个人信息(包括性别、年龄、教育程度以及被叫电话号码)以及通话的详细情况(如通话质量的优劣、参与交谈的人数等)。
值得一提的是,这些电话交谈的双方均为越南语母语者,确保了对话内容的真实性和准确性。同时,所有通话均发生在美国和加拿大的国内地区,进一步保证了数据的广泛性和代表性。
获取方法:
方法1:注册LDC账号并加入组织获取数据,官网链接:LDC官网
方法2:关注公众号,回复CALLFRIEND VietnameseLDC语料小助手https://mp.weixin.qq.com/s/8GgZFh9XAr7FYwivQ_ajRg