首先浏览官网的FAQ:https://nlp.stanford.edu/software/segmenter-faq.html
D:\eclipse-workspace\Stanford_segmenter\导入的包>java-cp stanford-segmenter-3.7.0.jar -mx15g edu.stanford.nlp.ie.crf.CRFClassifier-prop ctb.prop -serDictionary dict-chris6.ser.gz -sighanCorporaDict data -trainFilectb.txt -serializeTo newmodel.ser.gz > newmodel.log 2> newmodel.err
准备4样东西
1、ctb.prop
2 dictchris6.ser.gz
3 data(下载的分词的中有,data文件夹)
4 tarin.txt 重新训练用的文本
格式: