python模块
文章平均质量分 66
水...琥珀
数据挖掘,自然语言处理,如果恰巧你也是,同行!
展开
-
windows 安装pytorch 权限问题
环境说明:windows10 python3.6 anaconda31.按照进入pytorch官网https://pytorch.org/选择正确的命令它会自动为你选择一些配置,复制命令我选择的是:conda install pytorch torchvision cudatoolkit=10.1 -c pytorch2.安装出现报错:ERROR conda.core....原创 2019-11-12 08:27:48 · 1336 阅读 · 1 评论 -
小点dian儿:pandas混淆矩阵
import pandas as pd pd.crosstab(y_Test,prediction, rownames=["lable"],colnames=["predict"])y_Test,真实值prediction,预测值rownames=["lable"],行名colnames=["predict"],列名原创 2018-12-28 10:13:01 · 1579 阅读 · 0 评论 -
python 分词器使用
个人接触的分词器 安装 调用 jieba“结巴”中文分词:做最好的 Python 中文分词组件https://github.com/fxsjy/jieba 清华大学THULAC:一个高效的中文词法分析工具包 https://github.com/thunlp/THULAC-Python FoolNLTK可能不是最快的开源中文分词,但很可能是最准的开源中文分词 https://g...原创 2018-08-08 11:02:32 · 2205 阅读 · 0 评论 -
python 哈工大NTP分词 安装pyltp 及配置模型(python3.5 3.6)
哈工大语言云 NTP python使用系统配置(方法windows通用): windows10 python3.5第一步 :安装pyltp(无果的) cmd pip install pyltp 失败 (无果的)[pip 指定 安装源方法安装] ,此方法很长时间,也不一定有结果,不建议再尝试啦(https://blog.csdn.net/shuihupo/article/d...原创 2018-08-10 22:11:14 · 15373 阅读 · 8 评论 -
python 分词器比较
个人接触的分词器jieba“结巴”中文分词:做最好的 Python 中文分词组件https://github.com/fxsjy/jieba清华大学THULAC:一个高效的中文词法分析工具包 https://github.com/thunlp/THULAC-Python FoolNLTK可能不是最快的开源中文分词,但很可能是最准的开源中文分词 https://github...原创 2018-08-06 11:22:33 · 1537 阅读 · 0 评论 -
分词工具 结巴个人词典构造
结巴结巴JIEBA项目github地址训练数据载入词典开发者可以指定自己自定义的词典,以便包含 jieba 词库里没有的词。虽然 jieba 有新词识别能力,但是自行添加新词可以保证更高的正确率 用法: jieba.load_userdict(file_name) # file_name 为文件类对象或自定义词典的路径 词典格式和 dict.txt 一样,一个词...原创 2018-08-05 22:40:19 · 5735 阅读 · 0 评论 -
FoolNLTK 及 HanLP使用
个人接触的分词器 安装 调用 jieba“结巴”中文分词:做最好的 Python 中文分词组件https://github.com/fxsjy/jieba 清华大学THULAC:一个高效的中文词法分析工具包 https://github.com/thunlp/THULAC-Python FoolNLTK可能不是最快的开源中文分词,但很可能是最准的开源中文分词 https://g...原创 2018-08-09 17:10:29 · 3769 阅读 · 0 评论 -
中文分词工具比较 6大中文分词器测试(哈工大LTP、中科院计算所NLPIR、清华大学THULAC和jieba、FoolNLTK、HanLP)
#!/ Mypython# -*- coding: utf-8 -*-# @Time : 2018/8/5 22:19# @Author : LinYimeng# @File : fenci_ceshi.py# @Software: PyCharmimport timetestCases=["结婚的和尚未结婚的确实在干扰分词啊&a原创 2018-08-09 17:08:41 · 31698 阅读 · 12 评论 -
python 学习 json 大汇总
会涉及的json内容点:存取JSON文件json和python对象转换JSON的“引号”中文编码json 会被忽视的参数和字典的关系常见报错如果你要处理的是文件而不是字符串,你可以使用 json.dump() 和 json.load() 来编码和解码JSON数据。例如:存取JSON文件# 写入 JSON 数据with open('data....原创 2018-08-03 21:39:20 · 324 阅读 · 0 评论 -
python模块之pillow
ppt 在邮箱及群上原创 2018-06-12 10:55:28 · 266 阅读 · 0 评论