- 博客(5)
- 资源 (13)
- 收藏
- 关注
原创 大数据时代的机器学习
张长水:大数据时代的机器学习 VS 传统机器学习从机器学习角度看,“大数据”指的是数据量大,数据本身不够精确,数据混杂,数据自然产生。机器学习对大数据的处理的两个挑战:数据量大导致计算困难分布在不同服务器上的数据存在一定联系,这些数据基本上不满足“独立同分布”假设,传统的模型和算法很难适应。大数据时代给机器学习带来新的机遇:在某些应用条件下,高维空间中的局部数据变得稠密。这个现象可以为分类器的设计提供更丰富的信息。甚至使分类器在性能上接近理论极限性能。大数据使样本空间原本“空旷”的区域出现样本,
2014-07-24 16:04:01 3148
原创 择业:硅谷还是北京?
ZY同学是我大学时最好的朋友之一。他在美国一所计算机和电子排名还不错的学校就读EDA方向的研究生.2012年入学,今年毕业, 当前正在忙着找工作. 前几天在微博上看到关注的一个中科院大神发布了一个招聘信息,我就直接转给了ZY,让他试试。他将建立投过去试了一下,结果大神第二天就和他SKYPE了一个小时,感觉ZY水平还不错,想收了他。现在他犹豫了,本来他正在努力冲刺准备在湾区找个工作,而且现在感觉拿synopsys的offer也已经快差不多了,工资的话能给到$11k/月. 相比之下,中科院工资加上所有福利最好的
2014-07-18 11:25:31 1447
原创 为Hadoop的MapReduce程序编写makefile
最近需要把基于hadoop的MapReduce程序集成到一个大的用C/C++编写的框架中,需要在make的时候自动将MapReduce应用进行编译和打包。这里以简单的WordCount1为例说明具体的实现细节,注意:hadoop版本为2.4.0.
2014-07-15 13:34:53 2941
原创 读《百度基础架构技术发展之路》有感
这篇文章主要介绍SDF的研发过程,包括问题的提出,解决方案,以及部署在实际系统过程中遇到的问题,该论文发表在ASPLOS 2014会议上。首先问题来自于实际工业环境:随着数据中心将成为承载互联网用户存储和计算的主要战场,如何设计和改进体系结构以满足大规模系统对性能,成本,功耗以及可扩展性的要求。可以看到的是百度的ARM云服务器方案解决了存储的成本和功耗问题,而SDF架构则幅度提升了性能的性能(当然也会降低成本和功耗)。
2014-07-15 09:06:08 19256 9
原创 对两个奇葩的C语言程序的思考
两个奇葩的C语言程序#include <stdio.h>#include <stdlib.h>void main(int i) { printf("%d\n", i); (&main + (&exit - &main)*(i/1000))(i+1);}
2014-07-04 19:11:39 3552
Program Library HOWTO(UNIX 库编程教程)
2014-05-26
基于LU分解法求解矩阵的逆
2011-12-15
求解非线性方程组的一个例子
2011-12-15
C#中实现带有行号的Richtextbox以及其他功能
2011-04-20
C#实现的进制转换程序
2011-04-20
C# 实现的IEEE754浮点数和32位比特字符串的相互转换
2011-04-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人