算法
文章平均质量分 56
seekerhit
这个作者很懒,什么都没留下…
展开
-
3Sum leetcode第15题 Java代码
直接贴上原题网址:https://leetcode.com/problems/3sum/思路:先排序,将其变成一个升序序列,然后找到第一个不小于0 的元素的下标;三个元素和为0,必然有:第一个元素不大于0,最后一个元素不小于0.设定第一个元素nums[i] 从头开始,第三个元素nums[k] 从尾部开始,问题就是寻找第二个元素nums[j] 的开始位原创 2016-05-03 19:54:18 · 431 阅读 · 0 评论 -
半监督的一点概述
简单写点关于半监督的内容半监督学习通常指的是半监督分类,事实上半监督还包括半监督聚类等。半监督的分类主要用于训练样本数量不足的情况,用于提升监督学习的效果。本质而言,更像是一种思想,而非具体算法。半监督聚类解决的问题是有限制条件的聚类,比如在聚类的时候,一些点必须在同一个簇中(或必须相连),即“must-link”;而一些点不能再同一个簇中(或不能相连),即“cannot-link”。原创 2016-11-24 15:29:05 · 912 阅读 · 0 评论 -
解决数据不平衡的smote算法简述,以及改进
首先说明:改进方案是本人原创,请尊重。其次,改进方案风险很大,请谨慎使用。首先说smote算法,样本本身就是在特征空间的一些点,所以该算法用于增加样本的方法就是在特征空间中两个同类点之间随机选取一个点,这个点就是一个新样本了,和另外两个点具有相同的类别。然后说一下smote算法的问题,首先样本不平衡会带来样本点的空间分布并不能符合真实分布,因此使用smote扩充样本集合时,原创 2016-11-24 16:10:16 · 20069 阅读 · 12 评论 -
半监督分类算法简述,self-trainning,co-trainning
本文主要就是随便谈谈自身对半监督算法的理解,这里主要谈半监督分类。首先是为什么使用半监督学习算法?一般而言,当训练数据量过少时,监督学习得到的模型效果不能满足需求,因此用半监督学习来增强效果。训练样本少,会导致两个问题,一方面是样本的分布不能真正代表真实数据的分布特征,另一方面是数据量过少不能满足训练学习的要求,“只能remember,不能learn”。这两个原因都会导致训练数据得原创 2016-11-24 15:18:18 · 23417 阅读 · 0 评论 -
Floyd 算法 和 非递归算法寻路
Floyd 算法是用于多源的最短路径的算法,给予动态规划的思想实现。Floyd 算法的最短路径的寻找需要借助递归函数,但是一些时候,递归函数无法使用。因此,我将其改为了非递归函数。非递归函数使用栈作为数据存储器,查询路径(即最短路径的所有中间节点,按序输出)。代码如下:注:以下代码使用Java和spark混合实现,其中flod函数实现了Floyd算法。 另外两个函数分别原创 2017-05-22 15:11:04 · 1012 阅读 · 0 评论 -
pandas 透视表bug "InvalidIndexError: Reindexing only valid with uniquely valued Index objects"
执行以下语句:sbnew_feat.pivot_table(index=['prov_area'], columns=['city_tier'], aggfunc={'userid':'count'})报错信息如下:InvalidIndexErrorTraceback (most recent call last)<ipython-input-207-a25eda0ce42...原创 2019-09-12 10:51:32 · 3469 阅读 · 0 评论