自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 《Parallel batch k-means for Big data clustering》 SCI (聚类k-means)

将数据集拆分为等分区并减少计算的指数增长。目标是保留特征数据集的同时提高聚类速度。为每个分区计算簇的中心,它们被合并并在以后聚集。还考虑了确定最佳批量大小的方法。本文通过将复杂计算分成多个简单运算(大小一致),先并行对多组数据进行聚类寻找中心,然后获得多个中心,将中心再用于聚类得到最终中心每一组的数量计算 k 是簇数,r 是相对差异,v(a)是依表所得。总结:这篇论文的改进比较简单,总的思想就是“大事化小“,将复杂问题拆分成同规模的简单小问题(小问题可以并行处理),然后在此基础上再解决问题。

2021-12-23 09:14:55 1317

原创 《Collaborative filtering recommendation algorithm based on interactive data classification》EI (推荐算法

对基于矩阵分解的协同过滤的优化使用分类器对推荐内容进行过滤和聚类来解决训练数据稀疏问题 结合了MF(矩阵分解)和多层感知器(MLP)来优化预测效果,消除内积对模型表达能力的限制总体框架用户行为数据处理:这里注意的是用户看过并不代表用户喜欢(看了之后可能不喜欢),用户没看过也不代表用户不喜欢(可能压根不知道有这个数据)。在交互部分只需关注项目有没有被关注,因为普遍认为与用户交互的项目会得到更多的关注(理解起来就是有流量有话题我就考虑推荐,没流量的我就不推荐)本文是用到了

2021-12-23 09:13:51 496

原创 《Answer Category-Aware AnswerSelection for Question Answering》SCI (问答系统)

本文在是对问答系统的优化,加入答案类别进行优化总体架构:答案类别通过未标注的答案和已标注的问题分类来获得Embedding Layer输入问题和答案转换成向量QA Encoding Layer将上一层的输出作为输入,输入到BILSTM模型中,用于提取文字信息,再通过最大池化来形成注意力向量Attention-Based SLENAttention Module使用注意力模块来加强问题和答案之间的呈现,能更好的关注句意Shared Label Embedding N

2021-12-23 09:11:59 179

原创 《面向中文医疗事件的联合抽取方法》CSCD

本文对肿瘤数据进行信息抽取,包括肿瘤原发部位和原发肿瘤大小的联合抽取(因为二者是存在关联的所以可以采用联合抽取),肿瘤转移部位的抽取。肿瘤原发部位(实体抽取) BILSTM-CRF 基于肿瘤大小的特殊结构(MM或CM结尾,还有*,x,X等符号)来获取候选词 基于候选词和肿瘤原发部位形成元组,计算得分最高的元组中的肿瘤大小作为原发肿瘤大小 肿瘤转移部位的抽取 先筛选句子,使用CNN模型对句子进行分类,最后使用BILSTM-CRF做实体抽取本文提出了一种基于关键信息全域随机替换的伪数据生...

2021-12-23 09:10:47 608 1

原创 《基于移动互联的智慧健康社区系统的研发》 CSCD

为满足居民社区医疗服务的需求,本文通过在医院信息系统(HIS)的基础上来开发一个智慧健康社区系统。系统:用户使用手机端的Android,IOS;医护人员使用平板客户端的Android数据库:移动端使用SQLite,后台服务器使用MySQL移动端界面设计:Fragment组件后台服务器:Apache架构,PHP语言数据交换层:ActiveMQ消息中间件,Hessian服务器接口(比Web Service更简单快捷占用带宽更低,切跨语言)相关技术查询:SQLite和MySQL对比..

2021-12-23 09:09:33 2319

原创 《计算机技术在中医领域的应用及思考》CSCD

本篇论文是一片介绍性质的论文,介绍了目前计算机在中医上面的应用专家系统(模拟专家进行诊病治病) 辨证系统 (根据病人的情况表现判断病症)中医的辨证系统其实就是“望闻问切”的计算机化。望 要用到计算机视觉来对用户的外在特征进行分析 闻 文章没有提到闻,但是闻(听声息),可以利用现在的语音技术来收集病人的信息 问 对病人进行询问然后收集信息,这个其实和问答系统是一样的,计算机能够通过与用户的交互,利用数据的层次结构,逻辑结构,数据库关系这些能够很快的进行病人的数据收集 切 诊脉...

2021-12-23 09:08:23 1840

原创 《基于在线评论的旅游景点推荐算法研究》CSCD

本文就是通过分析计算用户评论对用户做一个偏好计算,然后进行推荐对用户旅游景点的在线评论信息进行获取和预处理,再利用情感强度分析法确定每条评论相对景点各属性的评价标度,然后依据处理后的在线评论信息计算用户对景点各属性的权重,最后排序给出推荐数据获取 Jieba分词 (可以考虑准确率更高的HanLp) 属性同义词合并 计算对属性的评价分值 (情感词典) 计算用户对属性的权重 TOPSIS排序相关查询:TOPSIS https://zhuanlan.zhihu.com/p...

2021-12-23 09:06:39 1021

原创 《跨社交网络的隐私图片分享框架》EI

本文从攻击者的角度,提出了三个攻击策略,然后根据这三个策略来提出解决方案。本文通过双层加密来保护隐私区域,通过传播链访问控制来限制用户操作,通过嵌套签名算法来保证溯源记录不被恶意篡改。本文的框架可以适用于跨平台,对于拍照录屏方式来存取图片,本文没有考虑,但是给出了相关的论文链接。整个的传播路径可以看作树状,在进行图片传播的时候自顶向下,顶部是图片所有者,中间节点是转发者,叶节点是静默接收者。在回溯的时候可以根据叶节点来找出相应的传播路径从而用于检查。本文首先通过调研来得出了图片隐私保护的必要

2021-12-23 09:04:28 1613

原创 《基于知识图谱的自杀倾向检测问答系统构建》CSCD

分词技术:HanLp自杀倾向文本分类技术:BILSTM词向量转换:BERT数据库:Neo4j本文的数据获取和图谱构造都是较为常规的方法,系统的设计点主要在问题理解部分。问题理解层次的输入时用户的问句。分词处理 这里对比了Jieba、HanLP、中科院分词NLPIR这三个工具,选择了准确率最高的HanLP工具。 问题分类 将用户的提问分为5类,使用分词,构造出每个类别的词云,然后计算分词后的单词的CHI值,排序选择每类CHI最大的150词,构造出1000多维的特征列表...

2021-12-23 09:03:24 1219

原创 《基于聚类的社交网络隐私保护方法》CSCD

目前用户要求系统能够很好的保护自己的隐私(不仅要保护固定的用户身份信息还要防治恶意者通过社交网络关系来分析处身份信息),数据挖掘人员又希望能够基于用户数据能更好的优化系统。基于这样的一个条件,这篇文章提出的基于聚类的社交网络隐私保护方法我觉得能够在二者之间有很好的平衡。保证数据在宏观上是准确的,局部信息某种程度的不准确性并不会影响到宏观性质的研究。论文采用的技术就是将单个用户的信息通过聚类,抽取类别信息,既可以保护用户的真正准确的信息,又可以让数据挖掘人员收集到大致信息。同时还给关键信息和非关键信息做了

2021-12-23 09:02:06 484

原创 《会话推荐系统》 CSCD

本文基于会话来做推荐系统,主要就是考虑到了短时间的行为对预测用户的下一行为会更有帮助,同时也解决了给未注册用户(游客)来进行推荐。文章给了4类的推荐方法,并进行了阐述马尔可夫能够做到对用户行为的推测。相较于之前看的协同过滤,基于用户或者物品的相似度计算来说的话,协同过滤是长时间的一种预测,会推测用户的长期需求。比如说a是小学生,a在购物平台上买了作业本之后,下一步基于马尔可夫推荐给他买铅笔,基于聚类给他推荐小学生最感兴趣的玩具。 两相比较,a买了本子之后更需要的是铅笔,所以推铅笔能够更好的符合逻

2021-12-22 11:20:18 656

原创 《舆情场景下基于层次知识的话题推荐方法》CSCD

本文是要做对用户的话题推荐,话题包含着知识,本文通过构建层次知识来增加话题信息之间的潜在语意关联。通过分析偏好知识和历史话题来刻画用户,以此来计算对候选话题的点击概览。总结:其实这篇期刊没咋看懂,我的理解是还是协同过滤,就是用户和话题这个打分不太好弄,就把话题分成了知识,知识之间又是分层次的,然后话题之间的相似可以用通过知识之间的相似来做,然后通过在计算用户之间的相似来刻画用户对象。这篇好难,没有get到他的逻辑。...

2021-12-22 11:18:46 164

原创 《基于交替最小二乘法的Spark个性化影片推荐系统》CSCD

技术工具: Hadoop、Spark统一部署环境,基于ALS协同过滤算法、MySql、Node.js 、Kettle工具(清洗数据)数据集:MovieLens推荐算法中存在 用户——物品 这样一个对应。产生的用户对物品喜爱度的矩阵可以通过先降维(矩阵分解),然后ALS求损失来构建协同过滤,来达到减少内存,降低存储时间复杂性。降维部分的设计用到了L2正则。上一篇论文也是协同过滤,两篇使用的相似度公式有些许差别,这篇减去了平均加权 ß《基于JSxxxx》 N是最临近的个数。分

2021-12-22 11:16:47 1275

原创 《基于JS的社交软件的设计与实现》硕士论文

技术和工具:Node.js、Express(Node.js的web框架)、Spark(计算引擎用于推荐算法)、Vue、WEEX(跨平台开发)数据库:MySql(存应用数据)、HBase(存推荐排序数据,可以让活跃数据存内存,提高速度)写了需求分析 对各个模块的功能和逻辑都给了具体的阐述,用例描述这个感觉好好提出了性能要求 给了整个系统的逻辑架构图(分层) 给了功能模块分解图 有数据库的设计,包括ER图和具体表的定义 对每个模块都进行了具体阐述给了逻辑和代码对应的方法 有测试功能和性

2021-12-22 11:15:35 1426

原创 《基于Java的网上购物系统的设计与开发》 硕士论文

这个论文基本上复刻了淘宝平台的一整套购物系统,在模块,功能方面也写得很详细,逻辑图的呈现也让我对整套功能体系更加熟悉。语言:java技术: struts (好像springboot用的人更多) MVC (在《微信xxx美食》那篇里面提到了MVVC,是这个的加强版) Hibernate (数据库技术) Javaweb(jsp,servlet,js,css,ajax(可用vue)) Oracle (相比mysql能处...

2021-12-22 11:12:54 1144

原创 《基于关联规则算法的电子商务商品推荐系统设计与实现》 CSTPCD期刊

本文是对关联规则算法FP-Grown算法的改进,利用改进算法对商品进行智能推荐。数据库:MySQL(上一篇论文用了mingodb,虽说可以提高效率,但是这个推荐算法还是需要用到关系型数据库)编译环境:JDK+Tomcat开发工具:MyEclipse开发语言:Java、JavaScript、MySQLFP-Grown算法:关于FP-Grow的理解:核心就是利用不断生成FP树来不断增加频繁集,一开始利用事务来构建初始的FPtree然后通过这个树来抽取条件模式基(如果是a就抽取a为

2021-12-22 11:11:43 9351

原创 《基于微信小程序的美食推荐系统》硕士论文

开发工具:微信开发者工具,vscode代码编辑器;框架:MVVM编写语言:Html/Css/Javascript/Node.js;数据库:Mongodb;后台Nodejs服务框架:Koa文章也包括了背景、微信小程序的好处、技术介绍 系统用户角色设计,设计了用户的可用功能和管理员的可用功能 系统功能概述:简述了7个功能模块。这里的美食推荐显示模块行,是random随机推荐,有点失望。 分析了可靠性,易用性,安全性,可移植性,维护性 给出了系统模块之间的关联 给出了数据库表的设

2021-12-22 11:10:34 13023

原创 《一卡通签到系统的设计与实现》硕士论文

功能:一卡通签到分析:由于设计到了一卡通所以对一卡通这个实体还有相关处理,还有一卡通管理系统、签到系统背景:一卡通推广以及师生对一卡通功能扩展的期望卡片:CPU卡(优先选用,安全性好) NFC卡相关技术; 接口规范,数据库规范 虚拟化技术平台:VMware,提高资源利用率,节省成本同时可以独立运行,集中管理 Web Service技术(网络模块):能够允许不同的计算机上运行不同的应用程序来交换数据或集成。而不需要额外的、专用的第三方软件或硬件...

2021-12-22 11:09:29 509

原创 《基于LSTM的食品安全自动问答系统方法研究》 EI期刊

功能:问答系统技术:LSTM ,Lucene检索数据来源:互联网爬取的文本作为非结构化数据集,形成文本库,本文是食品伙伴网中的食品安全相关新闻报道(约17万篇),再用文本分类技术自动抽取出其中的食品安全事件新闻(约7000篇)训练集:人工标注数据制作,本文共标注了899条问题答案对。 Lucene扩充正样本 填充负样本,保证正负样本各50%训练集:测试集=9:1对比:LSTM 优于 Lucene检索答案抽取方法:word2vec形成词向量(word wmbedding)[用b.

2021-12-22 11:07:15 216

原创 《基于itchat的微信群签到系统开发》 北大核心期刊

功能:签到系统载体:微信小程序微信小程序的好处:使用者 学生:学习成本低 老师:签到准备成本低,便于管理,操作简单开发者基于微信小程序搭建能利用微信的相关信息(GPS,学生信息)微信小程序方便上线和推广微信小程序开发简单微信在人群中普及微信小程序的不足:使用者:本文采取的方式需要对微信进行拉群,但实际是高校大多采用QQ拉群 本文是通过地理位置来对签到作弊进行防范,但是学生使用的app如学习通自带就有位置签到,手势签到这些功能,相比于学习通这个app,...

2021-12-22 11:05:14 403

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除