nlp入门第一课
一、 what is Natural Language Processing?
1. Question Answering (问答)
问:威尔金森的一本书使一个作家成功写成一部很有名的小说,问这个作家是谁?
答案:Bram Stoker
2.Infomation Extraction (信息抽取)
文本:
抽取结果:
3.Infomation Extraction (机器翻译)
4.现状和困难
4.1Ambigutity 一词多意
Fed raises interest rates
对这句话有下面两种构成,两种理解(NP:名次短语,N:名次)
第一幅 fed是主语,raise是动词,interest rates 是名词
第二幅 Fed raises构成名词短语,interest 是动词,rates是名词
4.2non-standard English
4.3segmentation issues
分词不同,那么句意及不一样
4.4tricky entity names
无法知道电影名字的开始和结束