python
qq_41728130
这个作者很懒,什么都没留下…
展开
-
NLP 预处理
1. nltk内置分词器导入模块from nltk.tokenize import LineTkoenizer,SpaceTokenizer,TweetTokenizerfrom nltk import word_tokenize首先生成对象,然后调用tokenize方法LTokenize=LineTokenizer()#按行分词out=Ltokenize.tokenize('my ...原创 2019-10-29 10:51:00 · 174 阅读 · 0 评论 -
自然语言处理——nltk——语料库
1. 语料库和WordNet语料库可以从wordnet内置语料库导入,也可以从外界导入1.1 访问内置语料库内置语料库列表可以在nltk官网查询from nltk.corpus import reuters #路透社语料库查询语料库内容,可以调用对象的fileids()函数, 该函数得到文件及其相对路径files=reuters.fileids()print(files)进一...原创 2019-10-28 08:42:03 · 721 阅读 · 0 评论 -
Numpy 学习笔记
1. 多维数组数据类型:ndarray,通用的多维同类数据容器属性:data.shapedata.dtype1.1 生成1.1.1 array函数及其他方法data1=[1,2.3,4,5]arr1=np.array(data1)data2=[[1,2,3],[3,4,5]]arr2=np.array(data2)arr2.ndimarr2.shapearr3=np.ze...原创 2019-10-19 20:21:40 · 92 阅读 · 0 评论 -
Python 数据处理学习笔记
内建数据结构1. 元组1.1 创建方式1.2 访问:通过[ ]1.3 特点元组方法2. 列表2.1 定义2.2 列表方法2.3 切片:2.4 内建函数序列2.4.1 enumerate2.4.2 sorted2.4.3 zip3 字典3.1 定义3.2 访问、插入、修改4. 集合4.1 创建1. 元组固定长度,不可变的对象序列;1.1 创建方式逗号分隔:tup=4,5,6tup=(...原创 2019-10-18 18:00:39 · 488 阅读 · 0 评论