tree-sitter-markdown 项目使用教程

宁乐钧Gwendolyn

于 2024-09-28 07:51:00 发布

阅读量628

点赞数 19

本文链接：https://blog.csdn.net/gitblog_00435/article/details/142609507

版权

tree-sitter-markdown 项目使用教程

tree-sitter-markdown Markdown grammar for tree-sitter 项目地址: https://gitcode.com/gh_mirrors/tre/tree-sitter-markdown

1. 项目介绍

tree-sitter-markdown 是一个用于 tree-sitter 的 Markdown 解析器。该解析器旨在根据 CommonMark 规范读取 Markdown，并包含一些来自不同来源（如 GitHub Flavored Markdown）的扩展。这些扩展可以在编译时启用或禁用。

主要目标

尽管该解析器已经存在一段时间，并且大多数明显的问题已经解决，但输出中仍然存在许多不准确之处。这些不准确性源于将复杂的 Markdown 格式限制在 tree-sitter 解析规则中。因此，不建议在需要高准确性的场景中使用此解析器。该解析器的主要目标是提供语法信息，以便在 neovim 和 helix 等编辑器中进行语法高亮。

贡献

欢迎所有贡献。有关详细信息，请参阅 CONTRIBUTING.md。

2. 项目快速启动

安装

首先，确保你已经安装了 tree-sitter。然后，克隆 tree-sitter-markdown 项目：

git clone https://github.com/tree-sitter-grammars/tree-sitter-markdown.git
cd tree-sitter-markdown

编译

使用以下命令编译项目：

make

使用

编译完成后，你可以使用 tree-sitter 解析 Markdown 文件。以下是一个简单的示例：

import tree_sitter
from tree_sitter import Language, Parser

# 加载语言
Language.build_library(
    'build/my-languages.so',
    [
        'tree-sitter-markdown',
    ]
)

markdown_language = Language('build/my-languages.so', 'markdown')
parser = Parser()
parser.set_language(markdown_language)

# 解析 Markdown 文件
with open('example.md', 'rb') as f:
    tree = parser.parse(f.read())

print(tree.root_node.sexp())