BERT进行文本分类和文本匹配的不同

最新推荐文章于 2022-10-10 00:00:28 发布

VIP文章 FIXLS

最新推荐文章于 2022-10-10 00:00:28 发布

阅读量1.9k

点赞数

分类专栏： NLP

本文链接：https://blog.csdn.net/baidu_15113429/article/details/103276576

版权

def convert_single_example(ex_index, example, label_list, max_seq_length,
                           tokenizer):
  """Converts a single `InputExample` into a single `InputFeatures`."""

  if isinstance(example, PaddingInputExample):
    return InputFeatures(
        input_ids=[0] * max_seq_length,
        input_mask=[0] * max_seq_length,
        segment_ids=[0] * max_seq_length,
        label_id=0,
        is_real_example=False)

  label_map = {}
  for (i, label) in enumerate(label_list):
    label_map[label] = i

  tokens_a = tokenizer.tokenize(example.text_a)
  tokens_b = None
  if example.text_b:
    tokens_b = tokenizer.tokenize(example.text_b)

  if tokens_b:
    # Modifies `tokens_a` and `tokens_b` in place so that the total
    # length is less than the specified length.
    # Account for [CLS], [SEP], [SEP] with "- 3"
    _trunca

最低0.47元/天解锁文章

优惠劵

FIXLS

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
BERT进行文本分类和文本匹配的不同

def convert_single_example(ex_index, example, label_list, max_seq_length, tokenizer): """Converts a single `InputExample` into a single `InputFeatures`.""" if isinstan...
复制链接

扫一扫