- 博客(4)
- 资源 (13)
- 收藏
- 关注
原创 Python2.7 把英文文档中的所有标点符号转为空格(或删除)
有时候做词频统计或者文档相似度时,首先我们需要过滤掉文件中的标点符号,然后根据空格来转化为一个个单词,以下我总结出两种方法:方法一: for p in string.punctuation: txt = txt.replace(p ," ")方法二:translation = string.maketrans(string.punctuation+string....
2019-04-12 17:21:25 8701 2
原创 算法-Python2.7实现对比两个文件(document)相似度(cosine distance)
#coding=utf-8import stringimport mathdef get_word_count (file) : txt = open(file).read().lower() #打开文件读取内容,并且把大写字母转化为小写字母 for p in string.punctuation: txt = txt.replace(p ," ") ...
2019-04-12 17:14:13 1324
原创 R语言求一行(列表、list)数据的平均数
R语言求一个列表的平均数可以使用mean() :mean英文意思有平均数的含义x=c(1,3,5,7,9)max(x)#这样即可求得平均数为 : 5假如读取过一个csv文件之后,要求其中一行数据中指定某个区间内的平均数可以使用rowMeans()data = read.csv(“input.csv",sep=",",header=T)rowMeans(dat...
2019-04-11 21:30:34 46973
原创 算法-Python2.7实现用数组看作堆来实现最优先队列(最大堆)
废话不多说,直接上代码# coding=UTF-8import numpy as npdef sift_down(parent): #向下调整 i = parent j = 2*i+1 tmp = npyArray[parent] while(j < len(npyArray)): if((j < ...
2019-04-11 21:12:41 257
基于网络用户评论的评分预测模型研究_.pdf
2019-05-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人