- 博客(4)
- 收藏
- 关注
原创 pandas基础操作
pandas中最基础的数据结构叫做DataFrame,类似excel中的表结构,包含栏与列的集合,可根据栏与列操作数据,类似R的DataFrame。下面来看一些基础操作,在数据清洗与处理阶段,这些操作需熟练掌握。1.建立DataFrameimport pandas as pd data = pd.DataFrame([['jerry','M',36],['emma','F',23]...
2018-09-22 23:29:13 245
原创 Python drop方法删除列之inplace参数
drop方法有一个可选参数inplace,表明可对原数组作出修改并返回一个新数组。不管参数默认为False还是设置为True,原数组的内存值是不会改变的,区别在于原数组的内容是否直接被修改。默认为False,表明原数组内容并不改变,如果我们需要得到改变后的内容,需要将新结果赋给一个新的数组,即data = data.drop(['test','test2'],1)。如果将inplace值设定为Tr...
2018-09-22 22:58:53 9306
原创 python装饰器
文章开始,讲个偷来的笑话,何为装饰器呢?众所周知,每个人都要穿内裤出门,内裤的作用是用来遮羞,但是如果寒风凛冽的冬天到了,我们想要一件东西来御寒,这个时候,可以选择把内裤拉长然后增加保暖功能,但是这样一来,一是麻烦,二是本来最重要的遮羞功能就要打折扣。那么我们人类是怎么办的呢?我们的选择是重新做一条在外面穿的裤子出来,可以穿在不同内裤的外面。装饰器的作用和刚刚的举例非常像。我们写好了代码,...
2018-09-18 22:46:04 144
原创 NLP之关键词提取
关键词提取就是从文本里面把跟这篇文章意义最相关的一些词语抽取出来,在文献检索、自动文摘、文本聚类/分类等方面有着重要的应用。关键词提取算法一般分为有监督和无监督两类有监督的关键词提取方法主要是通过分类的方式进行,通过构建一个较为丰富和完善的词表,然后判断每个文档与词表中每个词的匹配程度,以类似打标签的方式,达到关键词提取的效果。优点是精度较高,缺点是需要大批量的标注数据,人工成本过高,并且...
2018-09-12 11:36:52 18129
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人