- 博客(4)
- 收藏
- 关注
原创 深度学习图像分类:植物幼苗图像分类入门(Plant Seedlings Classification)
前言:深度考试期末的题目,植物幼苗分类,可以帮助农业领域的进步。 题目介绍:kaggle原题:可以下载数据集,查看一些参与者的思路等。 易用的深度学习框架Keras简介及使用 部分图片如下: 思路: 由于是图像分类问题,tensorflow官网提供了深度学习做图片分类的入门教材都是MNIST或者CIFAR-10的例子。但这里数据都是图片,还是需要自己读入和预处理,采用k...
2018-07-09 21:42:42 8418 12
原创 基于spark的社交网络分析-社团挖掘-链路预测-scala实现
基于spark的Facebook社团挖掘 数据集:SNAP数据中的facebook数据集从图论的角度来说,社团挖掘问题就是相当于一个图的分隔问题,即给定一个图G=(V,E),顶点集V表示社交网络中的用户,边集E表示用户之间的友好关系,社团挖掘的目的就是找到一种最优的分割图的方法,使得分割后形成若干个子图,跨越不同子图的边的数量尽可能得小,同一个子图内部的边的数量尽可能大。最常见的衡量...
2018-07-11 16:56:26 2574 1
原创 推特情感分析-基于spark
参考链接:使用spark Mlib 数据集下载:由于对Twitter的操作需要FQ,为方便大家进行后续实验操作,我们已将数据保存至tweets.json, donald.json及hillary.json中,json 文件地址将在后续实验操作时给出。tweets.json包括和川普及希拉里有关的推特,而donald.json和hillary.json仅包括其文件名代表的候选人有关推特。...
2018-07-11 16:42:02 2331 1
原创 电影推荐系统-基于spark
基于ml-100k电影数据集的推荐系统 数据集下载:https://grouplens.org/datasets/movielens/数据集如下: 在这里我用的python3.6和python的pyspark包进行实现的。 当然我们也可以启动hadoop,把数据文件放在hdfs上,代码也可以读取分布式文件。 算法:ALS算法,from pyspark import S...
2018-07-11 16:32:28 5363 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人