自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (13)
  • 收藏
  • 关注

原创 Python2.7 把英文文档中的所有标点符号转为空格(或删除)

有时候做词频统计或者文档相似度时,首先我们需要过滤掉文件中的标点符号,然后根据空格来转化为一个个单词,以下我总结出两种方法:方法一: for p in string.punctuation: txt = txt.replace(p ," ")方法二:translation = string.maketrans(string.punctuation+string....

2019-04-12 17:21:25 8701 2

原创 算法-Python2.7实现对比两个文件(document)相似度(cosine distance)

#coding=utf-8import stringimport mathdef get_word_count (file) : txt = open(file).read().lower() #打开文件读取内容,并且把大写字母转化为小写字母 for p in string.punctuation: txt = txt.replace(p ," ") ...

2019-04-12 17:14:13 1324

原创 R语言求一行(列表、list)数据的平均数

R语言求一个列表的平均数可以使用mean() :mean英文意思有平均数的含义x=c(1,3,5,7,9)max(x)#这样即可求得平均数为 : 5假如读取过一个csv文件之后,要求其中一行数据中指定某个区间内的平均数可以使用rowMeans()data = read.csv(“input.csv",sep=",",header=T)rowMeans(dat...

2019-04-11 21:30:34 46973

原创 算法-Python2.7实现用数组看作堆来实现最优先队列(最大堆)

废话不多说,直接上代码# coding=UTF-8import numpy as npdef sift_down(parent): #向下调整 i = parent j = 2*i+1 tmp = npyArray[parent] while(j < len(npyArray)): if((j < ...

2019-04-11 21:12:41 257

元智大学演算法与设计第十次作业

元智大学演算法与设计第十次作业

2019-06-10

元智大学演算法与设计第九次作业

元智大学演算法与设计第九次作业

2019-06-10

元智大学演算法与设计第八次作业

元智大学演算法与设计第八次作业

2019-06-10

元智大学演算法与设计第七次作业

元智大学演算法与设计第七次作业

2019-06-10

元智大学演算法与设计第六次作业

元智大学演算法与设计第六次作业

2019-06-10

元智大学演算法与设计第五次作业

元智大学演算法与设计第五次作业

2019-06-10

元智大学演算法与设计第四次作业

元智大学演算法与设计第四次作业

2019-06-10

元智大学演算法与设计第三次作业

元智大学演算法与设计第三次作业

2019-06-10

元智大学演算法与设计第二次作业

元智大学演算法与设计第二次作业

2019-06-10

元智大学演算法与设计第一次作业

元智大学演算法与设计第一次作业

2019-06-10

元智大学机器学习课程第一次小考

元智大学资讯工程专业机器学习第一次小考题目,简单的PLA算法。

2019-05-20

基于网络用户评论的评分预测模型研究_.pdf

通过网络用户评论, 为评论网站构建有效的评分预测机制。【方法】提出基于网络用户评论的评 分预测模型, 该模型包括 4 个模块: 网络用户评论获取模块、预测变量获取模块、预测分析模块以及预测结果评 价模块。抓取 30 部不同类型的电影评论数据, 27 部用于构建模型, 3 部用于检验模型。【结果】使用逐步回归方 法筛选出变量: 参与评分人数、参与评论人数、想要观看人数和电影正向评论情感均值, 构建评分预测模型。使 用 3 部电影验证, 预测评分与 IMDb 评分相差最大值为 0.0644, 最小值为 0.0227。【局限】在数据样本量、情感 特征提取精度、模型普适性验证等方面有待进一步提升。【结论】该模型能够依据用户评论对评分进行有效预测, 在网络水军探测方面也能发挥一定的作用。

2019-05-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除