![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
HanLP
文章平均质量分 92
说好今夜不点烟
有鸿鹄之志的燕雀
展开
-
宾州汉语句法依存指南 树库(3.0) 中文整理版
## 前言### 中文树库的设计问题1. 语言的复杂性。所需的语言复杂程度对于像汉语树库这样的带注释的文本语料库,与语料库的使用目的密切相关。由于这个Treebank的目的是提供一个工具来训练信息处理工具,如POS标记器和解析器,我们力求为我们所选文本提供坚实的语言学分析,基于当前的汉语句法研究和语言学专家参与了这个项目。然而,这是不切实际的提供高度复杂的树是目前语言学文献中常见的,也不是汽车我们声称我们可以为每一个句子提供“正确的”分析在语料库。结果是语言上的correctnéss和工程上的便利之间的原创 2021-09-26 13:35:53 · 1744 阅读 · 0 评论 -
技术改变生活——用HanLP来协助处理现实中问题
此例是我之前在学习nlp过程中的一个例子,需求如下: 平时收集了一下客户对于餐馆的评价,目标是将这些评价数据进行分类,比如分成满意或者不满意,这一类简单的客户评价情感极性分析,来策划餐馆满意菜品的推荐、用倾向性分析来改善餐馆的服务质量,以及提高创收利润。1 .首先来查看一下收集到的评价数据。评价数据的抽样:可以看到数据集中有餐馆的id编号,以及对餐馆的评价分数(总体评分、环境、口味、服务)2. 数据清洗: 在语料库中找到我们感兴趣的东西,把不感兴趣...原创 2020-11-13 20:20:42 · 1357 阅读 · 0 评论