自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 pandas基础操作

pandas中最基础的数据结构叫做DataFrame,类似excel中的表结构,包含栏与列的集合,可根据栏与列操作数据,类似R的DataFrame。下面来看一些基础操作,在数据清洗与处理阶段,这些操作需熟练掌握。1.建立DataFrameimport pandas as pd data = pd.DataFrame([['jerry','M',36],['emma','F',23]...

2018-09-22 23:29:13 245

原创 Python drop方法删除列之inplace参数

drop方法有一个可选参数inplace,表明可对原数组作出修改并返回一个新数组。不管参数默认为False还是设置为True,原数组的内存值是不会改变的,区别在于原数组的内容是否直接被修改。默认为False,表明原数组内容并不改变,如果我们需要得到改变后的内容,需要将新结果赋给一个新的数组,即data = data.drop(['test','test2'],1)。如果将inplace值设定为Tr...

2018-09-22 22:58:53 9306

原创 python装饰器

文章开始,讲个偷来的笑话,何为装饰器呢?众所周知,每个人都要穿内裤出门,内裤的作用是用来遮羞,但是如果寒风凛冽的冬天到了,我们想要一件东西来御寒,这个时候,可以选择把内裤拉长然后增加保暖功能,但是这样一来,一是麻烦,二是本来最重要的遮羞功能就要打折扣。那么我们人类是怎么办的呢?我们的选择是重新做一条在外面穿的裤子出来,可以穿在不同内裤的外面。装饰器的作用和刚刚的举例非常像。我们写好了代码,...

2018-09-18 22:46:04 144

原创 NLP之关键词提取

关键词提取就是从文本里面把跟这篇文章意义最相关的一些词语抽取出来,在文献检索、自动文摘、文本聚类/分类等方面有着重要的应用。关键词提取算法一般分为有监督和无监督两类有监督的关键词提取方法主要是通过分类的方式进行,通过构建一个较为丰富和完善的词表,然后判断每个文档与词表中每个词的匹配程度,以类似打标签的方式,达到关键词提取的效果。优点是精度较高,缺点是需要大批量的标注数据,人工成本过高,并且...

2018-09-12 11:36:52 18129

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除