學習目標
這次 NLP 學習的短期目標是完成機器翻譯任務。
主要的問題是專有名詞(如術語、人名、地名等)無法被機器正確翻譯。
課程的目的是教導如何使用術語詞典來糾正機器翻譯,提高其正確率。
NLP (自然語言處理)
NLP 是一個讓計算機理解和處理人類語言的技術。其目的是將輸入的自然語言(如文本)拆解,並翻譯成另一種語言的輸出。
數據集
- 訓練集(Training Set)是用於訓練模型的數據庫。
- 開發/驗證集(Development/Validation Set)是用於評估模型在特定問題上的表現的數據集。
- 測試集(Test Set)是用於最終評估模型性能的數據集。