- 博客(6)
- 资源 (1)
- 收藏
- 关注
原创 随笔
电子时代经过有晶体管到硅片的进化,硬件介质发生变化,并在持续跟进中,包括量子态。从模拟电子到 数字电路,更加可计算。 体系结构也在不断的更新换代,并逐步存留下来intel的x86架构, 移动领域的arm架构, 当然也有国产运用的mips架构(用的太少);目前大都脱离不了冯若依曼体系,计算、存储单元,最基本的ALU单元。 上层系统运用也在发生变化, 操作系统
2015-12-15 22:29:57 518
原创 关于归一化
归一化在机器学习中经常避不过的一环。1、归一化方法:单纯数学层面的归一化(一般是0~1.0, 或者0~100, ): 1)除于最大:score = x/ max 2) 除间隔: score = x-min/ (max-min) 3)利用指数性质: score(x) = sigmoid(x), 或者其他类似的函数。 归一化到同
2015-12-14 21:35:58 1270
原创 一个日志挖掘流系统
在某厂工作中这个业务系统的复杂由于数据的庞大造成的。分为实时部分、批量挖掘部分。 由于批量挖掘系统利用hadoop的map reduce挖掘, 假设所有输入的数据位(DataA)一起合并到一个对外服务的分布式的key-value数据库(设为DataBase的A表)中, 数 据量大,挖掘就成长,从用户行为日志产生到最终灌入DataBase中最长有大约48小时的延时。中间结果都保留
2015-12-14 00:02:48 607
原创 一个简单的内存倒排索引
有任务需要对用户的词,检索到相应的广告词。(个性化的广告词),概括为:通过简短(a,b,c,d) 检索出 广告词(A, B ,C, D)1、如果内存一个比较简单的是在内存中做索引。 内存建索引的节省内存的方法: 1)广告词索引:id1-> A; id2 ->B; id3->C; id4 ->D; 2) 细粒度词到广告词的倒排索引: 建立
2015-12-13 01:27:11 2317
原创 插播一条广告:LDA预测代码阅读
代码: https://github.com/madlib/madlib/blob/master/src/modules/lda/lda.cpp里面有lda的预测功能。/** * @brief This function samples a new topic for a word in a document based on
2015-12-03 13:43:54 1252
原创 TensorFlow的代码框架
阅读TensorFlow的代码框架:https://github.com/tensorflow/tensorflow 2015.12.1的情况如上所示: google 目录下主要是Protobuf 的包,也是google的开源工具之一,用于序列化,各种schema格式化,支持多语言(c++、python)之间的转换。 TensorFlow目录: 主目录,后面
2015-12-01 23:07:19 13175
jpegsrc8( 8 version)
2010-01-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人