大数据分析
文章平均质量分 73
慢慢dream
这个作者很懒,什么都没留下…
展开
-
transH算法实现知识图谱补全实验
transH算法实现知识图谱补全实验1. 目的使用transH算法进行知识图谱补全实验2. 数据集本次实验采用freebase数据集的FB15k, 该数据集共有entity2id.txt,relation2id.txt,test.txt,train.txt和valid.txt共五个文件。实验过程中,训练时主要采用entity2id.txt,relation2id.txt,train.txt三个文件,测试集使用test.txt。3. 方法本次实验主要采用transH模型进行知识图谱补全实验,原创 2021-03-04 19:19:38 · 4972 阅读 · 11 评论 -
基于协同过滤算法和内容推荐算法实现电影推荐系统
基于协同过滤算法和内容推荐算法实现电影推荐系统本电影推荐系统算法是基于人人相似的协同过滤算法和基于内容的推荐算法相结合的混合推荐算法混合推荐算法大致流程:首先对数据集使用人人相似的协同过滤算法, 计算每个人与其他人的cos相似度, 选择相似度最高的人,推荐他看过的电影. 若最高相似度小于0.2则认为没有人与之相似, 改为采用基于内容的推荐算法解决. 若相似度最高的用户没有评分过4分的电影可推荐, 也采用基于内容的推荐算法进行推荐.人人相似的协同过滤算法:根据movieId合并movies.cs原创 2021-03-04 16:28:49 · 5074 阅读 · 2 评论 -
决策树 BP神经网络(BPNN) SVM实现iris鸢尾花数据集的分类
决策树 BP神经网络(BPNN) SVM实现iris鸢尾花数据集的分类决策树实现流程(详见代码)::1. 连续值处理iris数据集是连续数据, 因为连续属性的可取值数目不再有限,因此不能像处理离散属性枚举离散属性取值来对结点进行划分。因此需要连续属性离散化,这里对数据集的离散化策略是二分法,具体方法: 将连续属性a的取值从小到大排序, 将相邻的属性值的中位数作为候选划分点, 这样,n个属性值可得到n-1个候选划分点, 计算样本集基于每个划分点t二分后的信息增益, 选择信息增益最大的候选原创 2021-03-04 15:25:25 · 6284 阅读 · 3 评论