- 博客(17)
- 收藏
- 关注
原创 逻辑回归处理非线性特征,特征离散化以及高维稀疏特征
处理非线性特征我们都知道逻辑回归是个线性分类器,它的分类器形式为:f(x)=θ1x1+θ2x2+....+θnxnf(x)=\theta_1x_1+\theta_2x_2+....+\theta_nx_nf(x)=θ1x1+θ2x2+....+θnxn所说的线性是关于参数θ\thetaθ的线性,虽然它会经过一个sigmoid函数的映射,加入映射之后,会演变成:$hθ(x)=1/...
2019-04-30 10:33:56 4798
原创 L1,L2正则化的原理与区别
L1,L2正则化的原理与区别正则化的目的L0与L1范数L2范数L1,L2正则化区别正则化参数的选择参考是为了求招做的笔记,笔记中的内容很大一部分来自于我所看的一大部分博客,这篇我主要看的是链接: link. 文中标号的部分是我目前还没完全理解的部分。正则化的目的在我们做监督学习训练时,主要应用的思想是“最小化损失函数的同时规则化参数”, 最小化损失函数的目的是降低训练误差,拟合训练数据,参数...
2019-04-27 19:36:34 5625
原创 tensorboard 不能正常显示
我解决了半天,就是什么也显示不出来,觉得代码也对,路径也对。经过一番折腾之后,是发现自己保存的路径中有中文,所以不要把文件写在带有中文路径下!!!...
2018-11-30 14:21:28 918
原创 Leetcode 167.Two Sum II - Input array is sorted
题目描述为:一个按照升序排序后的数组,给一个目标数,从数组中找到两个数,相加之后等于目标数,返回其这两个数的索引,假定一定存在这样的两个数,并且一个数不可以重复使用,索引不是以1开始的,并且第二个数的索引要比第一个数的索引要大。我的愚蠢思路:对于所有能组成的数对组合,遍历一遍,如果二者相加等于目标数,就返回。同时,加了一个小trick,先找到比目标数大的索引,那么这个索引和之后的都不需要遍历,AC...
2018-03-28 22:14:48 318
原创 凸函数与凸优化的问题
此文大致从文章file:///C:/Users/Administrator/Downloads/cs229-cvxopt.pdf 翻译得到。1 介绍在机器学习的很多领域,我们是想优化一些函数的值,也就是给定一个函数f,我们想找到x,去最大或者最小函数f(x)的值。然而,找到一个函数的全局最优可能是一个困难的问题。凸优化能够在很多情况下找到全局的解答。2 凸集定义:一个集合C,如果对于任何x,y属于...
2018-03-28 15:23:45 2844 2
原创 线性分类器与非线性分类器
线性分类器和非线性分类器是我们经常说的词汇,然而我却并不知道他的真正含义,上网搜索了一下,材料也是很少。整理如下:对于二类的情形:线性分类:是用一个超平面能将正负样本区分开,表达式为y=wx,这里说烦人地超平面,对于二维的情况,可以理解为一条直线,如一次函数。他的分类算法是基于一个线性的预测函数,决策的边界是平的,比如直线和平面。非线性分类:他的分类界面没有限制,可以是一个曲面,或者是多个超平面的...
2018-03-28 09:21:49 1746
原创 Leetcode 119. Pascal's Triangle II
题目描述为,给定一个数字k,返回第k行的杨辉三角形。愚蠢的我,并不知道什么是杨辉三角形,大一的记忆已经丢失了,百度百科如下,经过百度之后,了解了杨辉三角形,解题思路为:创建一个二维的向量,每个元素赋值为1,然后根据第i行的第J列等于第i-1行的第i列和第i-1列的和这个规则,对每个元素重新赋值,其余端点和结尾数都为1,这个无需改变,我的AC代码为:class Solution {public:...
2018-03-27 14:48:55 174
原创 leetcode 66.Plus One
问题描述:我花费了大量的时间,就是因为问题的描述没有真正的看懂,哭哭啼。问题是,给定一个非负数,用一个数组表示,它的高位存在了数组的最高位,也就是digits[0]是存的高位,真的是很强歧义,实现加1的操作,敲黑板的是,如果最高位有进位,那么需要补充一位,为1。我是用了向量的插入操作,在向量开始的地方,插入1.我的AC的代码,击败了百分之98,成功的地方在于,我是没有进位之后,直接就返回了,因为没...
2018-03-26 21:45:57 145
原创 Distant Meta-Path Similarities for Text-Based Heterogeneous Information Networks论文
文章主要思想 两个实体没有共享的相同的邻居,但是如果二者的邻居越相似,那么这两个实体应该是更加相似的。(但是论文里好像不是这么做的呀,主要的还是用的相同的实体)一些基本的定义异质信息网络(HIN):一个图,实体集合映射一个类型集合上,关系集合映射到一个类型集合,其中实体或者关系的类型集合的种类大于1。网络模式(network schema):将网络映射之后的类型集合构成的。meta-path...
2018-03-19 18:30:51 445
原创 leetcode 35
问题描述:自己的解答:class Solution {public: int searchInsert(vector<int>& nums, int target) { int i; for( i=0;i<nums.size();i++) { if(target==nums[i]) { ...
2018-03-19 13:54:58 168
原创 Skip-gram模型与Hierarchical Softmax, Negative Sampling的优化方法
以前已经看过很多次Skip-gram模型,负取样方法,但是真正用的时候,对其中的原理仍然是一知半解,最近又阅读了一下‘Distributed Representations of Words and Phrases and their Compositionality’这篇文章,想把自己看懂的地方记录下来。可能部分内容有网络的引用,因为完全是比较粗糙的自己记笔记,就不一一列出了。Skip-...
2018-03-15 20:21:23 1902
原创 leetcode
现在又入坑到LeetCode,easy的题目也得写个老半天才能AC。写完之后,又忘记,所以决定还是记录一下吧,积累点经验呐!题目描述恩,题目就是这样,我当时是按数组做的,但是10^9这个,数组真存不了。所以采用了vector>的数据结构,存这个区间开始和结束这两个节点的值,然后计算是否有重合。重合的情况大概可以分为以下几类:对于这几种情况,我分开来判断,if((
2017-11-20 22:18:55 292
原创 神经网络的python实现
在Ng的机器学习课程中,看到了神经网络算法。但是算法看过之后,就会忘记。然后照着别人的代码敲了一遍,了解了神经网络算法的真正流程,对于算法细节,我就不赘述了,直接上代码,在代码中,写明实现的细节。构造一个三层的神经网络,输入层,隐藏层和输出层,分别记为input,hidden和output.创建一个神经网络的类,它的构造方法初始化输入层,隐藏层和输出层的神经单元个数,初始化神经单元的值,初
2017-08-24 13:46:49 1782
原创 数组与矩阵的区别 Python
在做乘法的时候,矩阵和数组傻傻分不清楚,频频报错,最后决定还是耐下心来看一下它们之间的区别。记录一下,但是别人可能不会看懂我的逻辑,我是在自己实现机器学习实战中的算法,虽然有代码,但是编程太Low,想自己写练习一下。回归主题吧,其中可能会包含我用到的函数也顺便记录一下吧。matrix是array的一个特例,它只能是二维,而array可以是多维的。array类型是不能够直接相乘的,它需要调用do
2017-08-10 16:29:27 5007
原创 acm1012
#includeint grade(int i){ int j; double sum=1; for(j=1;j { sum=sum*j; } //printf("%lf\n",sum); return sum;}int main(){ printf("n e\n");
2016-12-02 22:25:30 256
原创 acm1008
这道题的坑在于,如果两次停的层数相同,那么也需要加上停留时间#includeint main(){ int A; while(scanf("%d",&A)!=EOF) { if(A==0) break; int i,num,sum=0,n; int flag=0; for(i=
2016-12-01 14:41:25 317
原创 acm1005题
这道题来来回回做了好几遍,首先用递归写,栈溢出,接下来改算法,时间超时,后来的知道Mod7这个是有规律的,附上AC了的源代码#includeint f(int a,int b,int c){ int s[50]; s[0]=0; s[1]=1; s[2]=1; int j,sum,time; int i=3,s1;
2016-12-01 13:27:39 263
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人