- 博客(2)
- 收藏
- 关注
原创 【python】gensim corpora的简单使用
本文将展示gensim的一些用法。python环境:Anaconda3(Python3.7)使用gensim做自然语言处理的一般思路是:使用(处理)字典 ----> 生成(处理)语料库 ----> 自然语言处理(tf-idf的计算等)利用列表生成字典(dict):#导入模块from gensim import corporafrom pprint import ppr...
2018-12-11 12:33:48 11084 4
原创 Python的bytes和str理解,以及解码编码问题。
尝试将ascii文件转换成utf-8的编码格式.Python3有两种表示字符序列的类型:bytes和str。个人理解是,bytes是计算机能够识别的数据类型,然后str是Unicode字符,即是人比较容易理解的字符类型。以下代码包含在debug.py文件中:def main(): pass if __name__ == '__main__': main()...
2018-11-08 13:53:17 2602
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人