自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 资源 (1)
  • 收藏
  • 关注

原创 随笔

电子时代经过有晶体管到硅片的进化,硬件介质发生变化,并在持续跟进中,包括量子态。从模拟电子到 数字电路,更加可计算。         体系结构也在不断的更新换代,并逐步存留下来intel的x86架构, 移动领域的arm架构, 当然也有国产运用的mips架构(用的太少);目前大都脱离不了冯若依曼体系,计算、存储单元,最基本的ALU单元。          上层系统运用也在发生变化, 操作系统

2015-12-15 22:29:57 518

原创 关于归一化

归一化在机器学习中经常避不过的一环。1、归一化方法:单纯数学层面的归一化(一般是0~1.0, 或者0~100, ):       1)除于最大:score = x/ max        2) 除间隔: score = x-min/ (max-min)        3)利用指数性质: score(x) = sigmoid(x), 或者其他类似的函数。        归一化到同

2015-12-14 21:35:58 1270

原创 一个日志挖掘流系统

在某厂工作中这个业务系统的复杂由于数据的庞大造成的。分为实时部分、批量挖掘部分。         由于批量挖掘系统利用hadoop的map reduce挖掘, 假设所有输入的数据位(DataA)一起合并到一个对外服务的分布式的key-value数据库(设为DataBase的A表)中, 数 据量大,挖掘就成长,从用户行为日志产生到最终灌入DataBase中最长有大约48小时的延时。中间结果都保留

2015-12-14 00:02:48 607

原创 一个简单的内存倒排索引

有任务需要对用户的词,检索到相应的广告词。(个性化的广告词),概括为:通过简短(a,b,c,d)  检索出 广告词(A, B ,C, D)1、如果内存一个比较简单的是在内存中做索引。      内存建索引的节省内存的方法:      1)广告词索引:id1-> A; id2 ->B; id3->C; id4 ->D;      2) 细粒度词到广告词的倒排索引:      建立

2015-12-13 01:27:11 2317

原创 插播一条广告:LDA预测代码阅读

代码: https://github.com/madlib/madlib/blob/master/src/modules/lda/lda.cpp里面有lda的预测功能。/** * @brief This function samples a new topic for a word in a document based on

2015-12-03 13:43:54 1252

原创 TensorFlow的代码框架

阅读TensorFlow的代码框架:https://github.com/tensorflow/tensorflow     2015.12.1的情况如上所示:    google 目录下主要是Protobuf 的包,也是google的开源工具之一,用于序列化,各种schema格式化,支持多语言(c++、python)之间的转换。    TensorFlow目录: 主目录,后面

2015-12-01 23:07:19 13175

jpegsrc8( 8 version)

Copyright (C) 1994-2009, Thomas G. Lane, Guido Vollbeding. This file is part of the Independent JPEG Group's software. For conditions of distribution and use, see the accompanying README file.

2010-01-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除