数据分析
Mr愚先森
这个作者很懒,什么都没留下…
展开
-
非常全面的Pandas入门教程
pandas是基于NumPy的一种数据分析工具,在机器学习任务中,我们首先需要对数据进行清洗和编辑等工作,pandas库大大简化了我们的工作量,熟练并掌握pandas常规用法是正确构建机器学习模型的第一步。目录如何安装pandas 如何导入pandas库和查询相应的版本信息 pandas数据类型 series教程 dataframe教程 小结1. 如何安装Pandas最常用...转载 2019-11-21 16:00:08 · 1038 阅读 · 0 评论 -
jieba入门
1、三种分词模式 HMM是隐马尔可夫模型,默认是启用的jieba.lcut以及jieba.lcut_for_search直接返回 listimport jiebacontent = '小明是毕业于中国科学院的大学生'# 精确模式(试图将句子最精确地切开,适合文本分析)res2 = jieba.cut(content, cut_all=False, HMM=True)p...原创 2019-01-25 11:14:16 · 779 阅读 · 0 评论 -
Python自然语言处理(NLP)入门教程(NLTK库的安装和使用)
本文简要介绍Python自然语言处理(NLP),使用Python的NLTK库。NLTK是Python的自然语言处理工具包,在NLP领域中,最常使用的一个Python库。什么是NLP?简单来说,自然语言处理(NLP)就是开发能够理解人类语言的应用程序或服务。这里讨论一些自然语言处理(NLP)的实际应用例子,如语音识别、语音翻译、理解完整的句子、理解匹配词的同义词,以及生成语法正确完整句子...转载 2019-01-25 17:41:03 · 2674 阅读 · 0 评论