- 博客(10)
- 资源 (2)
- 收藏
- 关注
原创 mac word无法显示仿宋字体解决方案
这种情况大多数是因为没有安装相应的字体造成的。检查是否安装在应用程序中找到word,右键显示包内容依次点击Contents - Resources - DFonts,在这里边找是否有”Fongsont.ttf",如果没有说明没有安装,直接安装即可(可以在安装成功后按照此步骤检查)。下载ttf资源百度云资源文件:链接:https://pan.baidu.com/s/1QwCvJXgoz...
2020-02-19 15:00:06 9226
原创 Bert实现中文文本分类
文章目录参考文献参考文献1,NLP之BERT中文文本分类基本上有了一些介绍,但是缺少具体例子和明确的指明文件路径(应该给出例子)2,如何使用BERT实现中文的文本分类优点是有一个训练和测试集的流程图(可参考)3,使用Bert预训练模型文本分类弥补了1和2的缺点4,测试数据搜索关键词:中文文本分类数据集即可得到。提供小规模的训练样本。5,有用的搜索方式bert 短文本分类h...
2020-02-17 12:44:11 3081
转载 python字符串分割,保留分隔符
原文的代码是在看的头痛文章目录不保留分隔符保留分割符将分隔符放在句子后面不保留分隔符"[ ]"在里面填写分隔符,不会保留分隔符。import resentence = "你在北京 我,你是谁?在干嘛."items = re.split("[.。!!??;;,,\s+]", sentence.decode("utf8"))for item in items: pri...
2020-02-14 15:59:24 4225 1
原创 pandas读取excel出现乱码问题解决
文章目录问题描述问题解决参考链接问题描述读取excel,却出现了如下错误。u'1.G1P0\u5b5539+6\u5468LOA\u5355\u6d3b\u80ce\u987a\u4ea72.\u598a\u5a20\u671f\u7cd6\u5c3f\u75c53\u3001\u4f1a\u9634I\u5ea6\u88c2\u4f244.问题解决终归还是编码的问题。主要起作用的是先...
2020-02-13 22:44:27 13988 4
原创 crf++各平台使用方法
crf++具体的使用方式,我在这里就不给大家聊了。推荐一篇特别好的文章连接:CRF++进行中文分词实例linux安装:下载linux版本CRF++包-----CRF+±0.58.tar.gz,并解压。cd CRF++-0.58./configuresudo makesudo make installMac安装:1,进入终端窗口,可以按下Command+Space,接着输入T...
2020-02-13 17:27:46 766
原创 常识学习
Bert +CNNbert gpt elom之间的对比word2vec 和 CNN从word embedng到bert历史TF相关论文参考
2020-02-13 17:11:30 288
原创 人工智能入门-02概率论
概率论:其关注的焦点是无处不在的可能性文章目录概率分类古典概率条件概率学派划分频率学派贝叶斯学派概率估计方式最大似然估计法最大后验概率法参考文章概率分类古典概率使用公式通俗表示,即为条件概率条件概率(conditional probability)是根据已有信息对样本空间进行调整后得到的新的概率分布。假定有两个随机事件A和B,条件概率就是指事件A在事件B已经发生的条件下发生的概率,用...
2020-02-09 23:32:55 502
原创 中文分词理论知识
讨论中文分词使用范围时,可通过黑盒和白盒两个方面去考虑。黑盒即分词的基础理论知识去考虑,而白盒就需要从实际的测试和相关评测去得出结论。本文的目的是介绍一些分词的基础知识。...
2020-02-09 15:23:52 1623
原创 中文分词工具比较
在本篇文章中,将介绍9个常用的分词工具及其对比。jieba、SnowNLP、北京大学PKUseg、清华大学THULAC、HanLP、FoolNLTK、哈工大LTP、CoreNLP、BaiduLac。* 部分分词中有可参考的论文。如北大、清华,可引用文章目录简介1 jieba2 SnowNLP3 北京大学PKUse4 清华大学THULAC5 HanLP6 FoolNLTK比较相关文章参考文献...
2020-02-09 14:02:17 13383 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人