虽然还没有上过机器翻译概要的课,但是第三轮选课选进去了(听说给分不错),然后去要了课后作业,就是安装一些语言处理包。
运行环境:Anaconda+Tensorflow 2.3.0+Pycharm+Python 3.7
安装jieba
pip install jieba -i https://pypi.tuna.tsinghua.edu.cn/simple
通过清华源来安装。但是今天直接输pip install jieba
也很快,不知道为什么。所以自己安装的时候就没写源嘿嘿。如果是需要在虚拟环境里安装的,记得先activate 虚拟环境名
一下。
# -*- coding: utf-8 -*-
# @Time : 2021/3/19 14:18
# @Author : 拔牙不打麻药
# @FileName: test.py
# @Software: PyCharm
import jieba
seg_list = jieba.cut('今天晚饭吃什么好呢?')
print(" ".join(seg_list))
安装NLTK
参考教程:https://blog.csdn.net/sinat_34328764/article/details/94830948
先安装一下:
pip install nltk -i https://pypi.tuna.tsinghua.edu.cn/simple
然后在https://github.com/nltk/nltk_data中下载数据包(不知道为什么github老是打不开,上午打不开,中午可以登上,下午又打不开了,大无语,所以其实我用codechina下载的)
下载了之后要先确定放在哪个位置,
在控制台中输入
import nltk