- 博客(7)
- 资源 (6)
- 收藏
- 关注
原创 Linux - 进程查看与管理
标签(空格分隔): Linux进程的静态查看查看系统所有进程ps -ef – 输出来好乱,看不懂..;ps aux – a表示所有与终端相关的进程,u表示所有以用户组织的进程状态的信息,x表示与终端无关的所有进程;ps -lAps -l – 只查看与shell有关的进程(即在shell上通过命令或者可执行程序创建的进程)ps -lU username 或者 ps -fU username–
2016-09-25 20:26:53 284
原创 Linux -- 文件统计常用命令
标签(空格分隔): Linuxsort – 文件内排序命令sort将文件的每一行作为一个单位,相互比较,比较原则是从首字符向后,依次比较其ASCII码。按每行升序排序: sort seq.txt在输出行中去除重复行: sort -u seq.txt输出行按降序排序: sort -r seq.txt 将输出结果重定向写入新的文件: sort seq.txt > seq1.txt将输出
2016-09-25 17:04:46 286
原创 再论最小二乘
标签(空格分隔): 机器学习前面有写过一篇关于最小二乘与最大似然估计的博客点我点我,该博客从二者的本质不同进行了分析(一个是为了最好的拟合数据,一个是通过概率分布使时间最可能发生)本篇博客将从目标函数求驻点及梯度下降的角度比较二者的不同。最小二乘目标函数目标函数实际是从拟合中残差服从高斯分布推导出来的,但实际我们可以直接使用: J(θ)=12(hθ(x(i))−y(i))2=12(Xθ−y)T(X
2016-09-19 17:06:42 293
原创 再论EM算法的收敛性和K-Means的收敛性
标签(空格分隔): 机器学习(最近被一波波的笔试+面试淹没了,但是在有两次面试时被问到了同一个问题:K-Means算法的收敛性。在网上查阅了很多资料,并没有看到很清晰的解释,所以希望可以从K-Means与EM算法的关系,以及EM算法本身的收敛性证明中找到蛛丝马迹,下次不要再掉坑啊。。)EM算法的收敛性1.通过极大似然估计建立目标函数:l(θ)=∑mi=1log p(x;θ)=∑mi=1log∑zp(
2016-09-19 14:47:36 11043
原创 L0/L1/L2范数的联系与区别
标签(空格分隔): 机器学习最近快被各大公司的笔试题淹没了,其中有一道题是从贝叶斯先验,优化等各个方面比较L0、L1、L2范数的联系与区别。L0范数L0范数表示向量中非零元素的个数: ||x||0=#(i) with xi≠0||x||_{0} = \#(i)\ with\ \ x_{i} \neq 0也就是如果我们使用L0范数,即希望w的大部分元素都是0. (w是稀疏的)所以可以用于ML中做稀
2016-09-18 09:38:40 756
原创 XML学习笔记(二)-- DTD格式规范
标签(空格分隔): 学习笔记 XML的一个主要目的是允许应用程序之间自由交换结构化的数据,因此要求XML文档具有一致的结构、业务逻辑和规则。可以定义一种模式来定义XML文档的结构,并借此验证XML文档的有效性。 定义XML文档结构有两种解决方案:一种是采用文档类型定义DTD;另一种是采用XML Schema。DTD的基本结构DTD是用来规范XML文件的格式,必须出现在头文件中,一遍XML
2016-09-16 21:48:18 560
原创 Spark学习(一)--RDD操作
标签(空格分隔): 学习笔记Spark编程模型的两种抽象:RDD(Resilient Distributed Dataset)和两种共享变量(支持并行计算的广播变量和累加器)。RDDRDD是一种具有容错性的基于内存的集群计算方法。 RDD特征: 1. 分区(partition):有一个数据分片列表,能够将数据进行切分,切分后的数据能够进行并行极端,是数据集的原子组成部分; 2. 函数(comp
2016-09-11 15:24:09 405
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人