一. 下载github仓库
服务器
cd ~
mkdir code
cd code
git clone https://github.com/shibing624/pycorrector.git
本地
在你的本地电脑适当位置下载仓库
git clone https://github.com/shibing624/pycorrector.git
二. 打开pycharm
1. 用pycharm打开本地电脑中的仓库目录
2. 配置远程连接
Tools->Deployment->Browse Remote Host
点击那个...符号 选择SFTP连接,名字随便起点ok
点...符号,会弹出一个SSH Configurations的框 点左上角加号(见下一个图),步骤2中的Root path要写绝对路径,不能简写,需要将 ~ 替换为实际的路径,查看绝对路径方式为在服务器输入以下命令,步骤
cd ~/code
pwd
填写服务器信息,Test Connection显示success即配置成功
Local path默认就行,就是你当前项目的目录,Deployment path写文件夹名就可以,3中设置看下一个图
加+号,然后选择Deployment Path,然后点文件夹符号,选择你服务器上的anaconda python的环境地址,可以通过在服务器命令行输入以下命令辅助查找
whereis python
然后你就可以在本地使用pycharm控制远程服务器代码了,运行也是使用的远程服务器
3. pycorrector初解
首先,pycorrector是一个基于深度学习模型+语言模型的自动中文文本纠错包,他既是一个工具,可以直接拿来用,又开源了训练代码,
训练过程使用的代码在pycorrector/pycorrector中,可以看到,分别使用了seq2seq、transformer、ernie、electra、macbert等模型,具体模型使用点进去有Readme
以Seq2seq为例
你今天的任务就是 随便选一个模型 看一下他的代码思路 可以运行一下最好。运行需要下载数据集,服务器应该没法下载百度网盘的东西,所以你要下载到本地后,在上传到服务器,在本地输入以下命令,
其中-P后面写你服务器的端口号,your_local_file是你本地文件的路径及名称,后面是你服务器的 用户名@ip地址:目标路径
scp -P 1234 -r your_local_file xxx@10.10.10:~/code/