[elasticsearch笔记] _termvectors/_mtermvectors

本文聚焦于Elasticsearch的_termvectors和_mtermvectors API,详细阐述如何利用这两个工具来统计term的相关数据,如total term frequency (ttf)、document frequency (df)和document count (dc),以及term出现频率(term_freq)。通过这些统计信息,可以深入分析和理解索引中的文本数据。
摘要由CSDN通过智能技术生成

重点

  • 统计 term 相关数据
  • ttf: total term frequency
  • df: document frequency
  • dc: document count
  • term_freq: term 出现频率

_termvectors

PUT /twitter
{ "mappings": {
    "properties": {
      "text": {
        "type": "text",
        "term_vector": "with_positions_offsets_payloads",
        "store" : true,
        "analyzer" : "fulltext_analyzer"
       },
       "fullname": {
        "type": "text",
        "term_vector": "with_positions_offsets_payloads",
        "analyzer" : "fulltext_analyzer"
      }
    }
  },
  "settings" : {
    "index" : {
      "number_of_shards" : 1,
      "number_of_replicas" : 0
    },
    "analysis": {
      "analyzer": {
        "fulltext_analyzer": {
          &
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值