自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小H来开荒~

此博客目前正在施工中,尽请期待...

  • 博客(4)
  • 收藏
  • 关注

原创 Python提取CSV文件信息

前几天下载了一个视频数据集(http://www.cs.utexas.edu/users/ml/clamp/videoDescription/)Collecting Multilingual Parallel Video Descriptions Using Mechanical Turk其中有个csv文件表示了数据集的一些信息,如图所示:video名字为:VideoID_St

2016-09-22 15:52:04 3188 1

原创 用R语言生成DocumentTermMatrix(DTM)矩阵

在提取文本LDA时,需要先生成文档的DTM矩阵。对于DTM矩阵,维基百科上给出了详细的解释。有两个document分别名为D1,D2:也就是说DTM矩阵是每个Document中每个term(单词,或是词汇表vocab)出现的次数。R语言的tm包给出了直接求取dtm的接口library(SnowballC) library(NLP)library(tm) #

2016-09-22 15:23:53 18530

原创 Python对XML文件标签内容的匹配

对XML文件处理,有博客说明使用 import xml.dom.minidom但是这个包严格限制XML文件格式,XML中若含有一些未知的标签如,无法进行解析Offa was frequently in conflict with the various Welsh kingdoms. There was a battle between the Mercians and the Wels

2016-09-22 15:10:47 4561

原创 C/C++复习(7):指针

1、关于指针的几个声明的含义int * p[10]; //定义了数组p,数组元素是int型的指针 (指针数组)int (*p)[10]; //定义了数组指针p, p指向一个10个元素的数组,数组的元素是int型数据int * p(int); //函数p,有一个int型参数,返回值为int指针int (*p)(int); //函数指针p,p所指向的函数有一个int型参数,返回in

2016-09-14 16:15:36 347

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除