QIUXP-预训练语言模型:BertMarker:MarkBERT: Marking Word Boundaries Improves Chinese BERT

MarkBERT: Marking Word Boundaries Improves Chinese BERT

作者觉得现有的基于words作为一个unit的方式,对于OOV和中文并不十分适用。
提出的markbert,是在以词组为切割的基础上,还加入了marker标记。

预训练任务包括两种:

The first task is masked language modeling and we
also mask markers such that word boundary knowledge can
be learned since the pre-trained model needs to recognize
the word boundaries within the context. The second task is
replaced word detection. We replace a word with artificially
generated words and ask the markers behind the word to predict whether the word is replace

在replace word detection中,混淆词的构造可以是多种多样的。我们采取了两种简单的策略:(1)我们使用同义词作为混淆;(2)我们使用中文中语音(拼音)相似的词。为了获得同义词,我们使用Zhang和Yang(2018)提供的外部词汇嵌入。我们计算单词之间的余弦相似度,并使用最相似的单词作为同义词混淆。为了获得基于语音的混淆,如图2所示,我们使用一个外部工具来获得单词的语音,并选择一个与之混淆的单词共享相同的语音。

在这里插入图片描述

模型结构

在这里插入图片描述

作者觉得,这种预训练方式更有助于中文NER中的marker标记下的识别。我不觉得特备好。而且论文的实验上,做的并不是很充分。

Fusionlane是一种多传感器融合技术,用于车道标志语义分割。该技术通过将来自多个传感器的数据进行融合,提高了车道标志语义分割的准确性和稳定性。 传统的车道标志语义分割方法通常只使用一种传感器的数据进行分析,例如使用单个摄像头捕获的图像。然而,由于不同传感器的特点和性能各异,使用多个传感器的数据进行融合可以提供更全面和准确的信息。 Fusionlane通过整合来自多种传感器的数据,如摄像头、激光雷达、GPS等,可以综合利用各传感器的优点,弥补彼此的不足。例如,摄像头可以提供高分辨率的图像信息,激光雷达可以提供精确的距离和位置信息,GPS可以提供精确的车辆位置信息。融合这些数据可以提高车道标志语义分割的精度和鲁棒性。 Fusionlane算法首先对来自各传感器的数据进行预处理和校正,确保其在同一坐标系统和分辨率下进行比较。然后,通过使用深度学习等技术,将多传感器的数据进行融合和分析,得出车道标志的准确位置和类型。 与传统的单传感器方法相比,Fusionlane的优势在于能够提供更精确的车道标志语义分割结果。通过利用多传感器的数据,可以更有效地抑制光照变化、遮挡和噪声等问题,提高分割算法的鲁棒性。此外,融合多传感器的数据还可以提供更全面的环境感知,为自动驾驶等应用提供更准确和可靠的信息。 总之,Fusionlane是一种多传感器融合技术,用于车道标志语义分割。通过融合来自多种传感器的数据,可以提高分割的准确性和稳定性,为智能驾驶等领域的应用提供更可靠和高效的解决方案。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

YingJingh

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值