![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python学习 机器学习
文章平均质量分 84
zhangye_2017
这个作者很懒,什么都没留下…
展开
-
学习笔记第五篇之聚类算法
今年年初的时候学习了《机器学习》这本书中的算法,并实践了一些。现在整理成笔记,以后需要时还可以找到。 今天先写个简单的聚类算法。 1、K-means聚类 K-means算法是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的原创 2017-12-22 12:53:46 · 445 阅读 · 0 评论 -
学习笔记第六篇之聚类算法(学习向量量化)
今天记录一下之前做的用机器学习聚类算法中的学习向量量化方法做的实例,也是以此前的城市GDP数据为例。 算法如下: 输入: 样本集D={(x1,y1),(x2,y2),...,(xm,ym)};原型向量个数q,各原型向量预设的类别标记{t1,t2,...,tq};学习率e属于0-1。 过程: 1:初始化一组原型向量{P1,P2,原创 2018-01-01 16:02:10 · 3457 阅读 · 4 评论 -
学习笔记第八篇之rnn预测序列数据
这两天帮师兄处理一些论文要用到的数据。数据格式是已知序列的前面标签值,预测后面每条数据的标签值。 我开始的思路是用sklearn这个机器学习包用Python来写一个神经网络,用已知标签的数据去训练网络模型,然后预测后面的数据。但是结果总是不对,后来发现sklearn.neural_network的MLPClassifier只能用来处理二分类问题,而我的数据标签是二分类的。所以我改原创 2018-01-13 16:11:50 · 5322 阅读 · 3 评论 -
学习笔记第十篇之安全评估模型设计
最近老师的项目需要做一个安全评估模型,想到以后可能会用到,所以在此也记录一下。主要是根据已知标签的数据来预测后面数据的标签值。这里的标签是0或1,相当于二分类问题,所以我这里使用神经网络来训练模型,用的是python中的sklearn这个包。数据如下:3,4,7,4,5,2,0,1,11,3,7,4,5,2,0,0.3,06,4,5,4,5,2,0,1,15,3,5,4,5,2,0原创 2018-01-13 17:52:39 · 802 阅读 · 0 评论 -
学习笔记第十四篇之知乎社交网络分析
今天老师让分析一个关于知乎社交网络内容分析的项目。使用的是https://www.jianshu.com/p/3b2a1895a12d中的例子。该项目主要是根据知乎网站的用户的关注关系来分析知乎社交网络的。使用的数据包含:2.6万名用户,461条关注连接,72万个问题。数据下载在这里点击打开链接,实现代码在这里点击打开链接。文章分析了知乎社交数据的统计关系,网络的总体特征,网络连接分析和热点话题分转载 2018-04-10 21:15:01 · 2264 阅读 · 0 评论