自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

alex

NLP算法学习

  • 博客(5)
  • 资源 (19)
  • 收藏
  • 关注

原创 K-NN(K Nearest Neighbo,又称k近邻算法)

大晚上玩游戏无聊了,翻了下facenet谷歌人脸检测算法开源库,白天跟别人聊了下,K-NN算法,看facenet这篇论文时也提到了k-NN算法,所以记录下。 Machine learning最基础的算法,通过计算新数据与训练数据特征值之间的距离,然后选取K(k>=1)个距离最近的邻居进行分类或者回归。当k=1时,新数据将分配给其近邻类。 三个距离测量公式仅对连续变量有效。在分类变量的情况下,

2017-11-23 00:18:42 591

原创 机器学习最基础算法之最小二乘法(最小平方法)

最小二乘法(Least Squares Method, 简称LSE,又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟合。其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。 “最小二乘法”是对过度确定系统,即其中存在比未知数更

2017-11-19 00:31:07 7921

原创 BlobCache算法

BlobCache 提到此算法,就是想到上一篇LruCache算法 ,BlobCache 算法与LruCache算法都是图片缓存算法,在安卓中使用到 仅利用三个文件:Index文件,Active文件和Unactive文件。通过FileInputStream().getChannel().map()把索引文件直接映射到内存中,通过索引偏移来读取文件中的图片缓存。清除旧图片的方法就是see

2017-11-17 01:21:30 1239

翻译 (译文)TensorFlowLite

Google基于TensorFlow针对移动和嵌入式设备轻量级的机器学习框架。轻量级 启用具有较小二进制大小并且快速初始化/启动设备上机器学习模型。跨平台 可以运行设计跑到许多不同的平台上,从Android和IOS上开始快速 针对移动设备进行了优化,包括显着提高的模型加载时间,并支持硬件加速目前越来越多的移动设备采用专用的定制硬件来更有效地处理ML工作负载。 TensorFlow Lit

2017-11-17 00:53:02 2290

原创 性能优化整理

磁盘I/O优化 规则 方案 原因 避免主线程 I/O 避免主线程操作文件及数据库 一半的卡顿问题由主线程I/O 引起 apply替代commit apply异步,commit同步操作 提前初始化Sharepreference 多进程中初始化过程时在主线程中 减少I/O读写量 减少使用select查找语句 减少从数据库中读的数据量,耗时操作

2017-11-16 23:22:01 289

数据仓库工具箱(第3版)维度建模权威指南 中文版 高清带书签完整版

随着TheDataWarehouseToolkit(1996)第1版的出版发行,RalphKimball为整个行业引入了维度建模技术。从此,维度建模成为一种被广泛接受的表达数据仓库和商业智能(DW/BI)系统中数据的方法。该经典书籍被认为是维度建模技术、模式和实践的资源。   本书汇集了到目前为止最全面的维度建模技术。《大数据应用与技术丛书·数据仓库工具箱(第3版):维度建模指南》采用新的思路和实 践对上一版本进行了全面修订,给出了设计维度模型的全面指南,既适合数据仓库新手,也适合经验丰富的专业人员。   本书涉及的所有技术都基于作者实际从事DW/BI的设计经验,通过实际案例加以描述。   主要内容   ◆实用设计技术——有关维度和事实表的基本和高级技术   ◆14个案例研究,涉及零售业、电子商务、客户关系管理、采购、库存、订单管理、会计、人力资源、金融服务、医疗卫生、保险、教育、电信和运输等   ◆为12个案例研究提供了数据仓库总线矩阵示例   ◆需要避免的维度建模陷阱和错误   ◆增强的缓慢变化维度(SCD)技术类型0~类型7   ◆用于处理参差不齐的可变深度层次和多值属性的桥接表   ◆大数据分析的实践   ◆与业务参与方合作、交互设计会议的指南   ◆有关KimballDW/BI项目生命周期方法论的概论   ◆对ETL系统和设计思考的总结   ◆构建维度和事实表的34个ETL子系统和技术 目录 第1章 数据仓库、商业智能及维度建模初步 1.1 数据获取与数据分析的区别 1.2 数据仓库与商业智能的目标 1.3 维度建模简介 1.3.1 星型模式与OLAP多维数据库 1.3.2 用于度量的事实表 1.3.3 用于描述环境的维度表 1.3.4 星型模式中维度与事实的连接 1.4 Kimball的DW/BI架构 1.4.1 操作型源系统 1.4.2 获取.转换_加口载(ETL)系统 1.4.3 用于支持商业智能决策的展现区 1.4.4 商业智能应用 1.4.5 以餐厅为例描述Kimball架构 1.5 其他DW/BI架构 1.5.1 独立数据集市架构] 1.5.2 辐射状企业信息工厂Inmon架构 1.5.3 混合辐射状架构与Kimball架构 1.6 维度建模神话 1.6.1 神话1:维度模型仅包含汇总数据 1.6.2 神话2:维度模型是部门级而不是企业级的 1.6.3 神话3:维度模型是不可扩展的 1.6.4 神话4:维度模型仅用于预测 1.6.5 神话5:维度模型不能被集成 1.7 考虑使用维度模型的 更多理由 1.8 本章小结 第2章 Kimball维度建模技术概述 2.1 基本概念 2.1.1 收集业务需求与数据实现 2.1.2 协作维度建模研讨 2.1.3 4步骤维度设计过程 2.1.4 业务过程 2.1.5 粒度 2.1.6 描述环境的维度 2.1.7 用于度量的事实 2.1.8 星型模式与OLAP多维数据库 2.1.9 方便地扩展到维度模型 2.2 事实表技术基础 2.2.1 事实表结构 2.2.2 可加、半可加、不可加事实 2.2.3 事实表中的空值 2.2.4 一致性事实 2.2.5 事务事实表 2.2.6 周期快照事实表 2.2.7 累积快照事实表 2.2.8 无事实的事实表 2.2.9 聚集事实表或OLAP多维数据库 2.2.1 0合并事实表 2.3 维度表技术基础 2.3.1 维度表结构 2.3.2 维度代理键 2.3.3 自然键、持久键和超自然键 2.3.4 下钻 2.3.5 退化维度 2.3.6 非规范化扁平维度 2.3.7 多层次维度 2.3.8 文档属性的标识与指示器 2.3.9 维度表中的空值属性 2.3.10 日历日期维度 2.3.11 扮演角色的维度 2.3.12 杂项维度 2.3.13 雪花维度 2.3.14 支架维度 2.4 使用一致性维度集成 2.4.1 一致性维度 2.4.2 缩减维度 2.4.3 跨表钻取 2.4.4 价值链 2.4.5 企业数据仓库总线架构 2.4.6 企业数据仓库总线矩阵 2.4.7 总线矩阵实现细节 2.4.8 机会/利益相关方矩阵 2.5 处理缓慢变化维度属性 2.5.1 类型0:原样保留 2.5.2 类型1:重写 2.5.3 类型2:增加新行 2.5.4 类型3:增加新属性 2.5.5 类型4:增加微型维度 2.5.6 类型5:增加微型维度及类型1支架 2.5.7 类型6:增加类型1属性到类型2维度 2.5.8 类型7:双类型l和类型2维度 2.6 处理维度层次关系 2.6.1 固定深度位置的层次 2.6.2 轻微参差不齐/可变深度层次 2.6.3 具有层次桥接表的参差不齐/可变深度层次 2.6.4 具有路径字符属性的可变深度层次 2.7 高级事实表技术 2.7.1 事实表代理键 2.7.2 蜈蚣事实表 2.7.3 属性或事实的数字值 2.7.4 日志/持续时间事实 2.7.5 头/行事实表 2.7.6 分配的事实 2.7.7 利用分配建立利润与损失事实表 2.7.8 多种货币事实 2.7.9 多种度量事实单位 2.7.1 0年.日事实 2.7.1 1多遍SQL以避免事实表间的连接 2.7.1 2针对事实表的时间跟踪1 2.7.1 3迟到的事实 2.8 高级维度技术 2.8.1 维度表连接 2.8.2 多值维度与桥接表 2.8.3 随时间变化的多值桥接表 2.8.4 标签的时间序列行为 2.8.5 行为研究分组 2.8.6 聚集事实作为维度属性 2.8.7 动态值范围 2.8.8 文本注释维度 2.8.9 多时区 2.8.10 度量类型维度 …… 第3章 零售业务 第4章 库存 第5章 采购 第6章 订单管理 第7章 会计 第8章 客户关系管理 第9章 人力资源管理 第10章 金融服务 第11章 电信 第12章 交通运输 第13章 教育 第14章 医疗卫生 第15章 电子商务 第16章 保险业务 第17章 KimballDW/BI生命周期概述 第18章 维度建模过程与任务 第19章 ETL子系统与技术 第20章 ETL系统设计与开发过程和任务 第21章 大数据分析

2018-06-12

深入浅出数字信号处理_江志红

《深入浅出数字信号处理》是2012年北京航空航天大学出版社出版的图书,作者是江志红。本书可作为想利用数字信号处理这个强大工具的科研人员的参考用书。

2018-06-12

jenkins简单安装

jenkins简单安装部署,操作简易,通熟易懂,易学易操作,可以作为入门学习

2018-01-30

Oracle CrystalBall-64Bit

Oracle CrystalBall-64Bit

2015-01-03

ACM ICPC World Finals 2014

ACM ICPC World Finals 2014 第一圣彼得堡国立大学 第二 莫斯科大学 第三 pku

2014-06-25

httpwatch网页数据分析工具

HttpWatch是强大的网页数据分析工具.集成在Internet Explorer工具栏.包括网页摘要.Cookies管理.缓存管理.消息头发送/接受.字符查询.POST 数据和目录管理功能.报告输出.HttpWatch 是一款能够收集并显示深层信息的软件。它不用代理服务器或一些复杂的网络监控工具,就能够在显示网页同时显示网页请求和回应的日志信息。甚至可以显示浏览器缓存和IE之间的交换信息。集成在Internet Explorer工具栏。   只需要选择相应的网站,软件就可以对网站与IE之间的需求回复的通讯情况进行分析并在同一界面显示其相应日志记录。每一个HTTP记录都可以详细的分析其 Cookies、消息头、字符查询等信息。支持HTTPS及分析报告输出为XML、CSV等格式。

2012-12-10

2012ACM世界总决赛

ACM ICPC World Finals 2012(2012ACM世界总决赛华沙)

2012-05-18

C++语言矩阵加减法实现

C++编写,矩阵加减法三元组实现。 稀疏矩阵是指那些多数元素为零的矩阵。利用“稀疏“特点进行存储和计算可以大大节省存储空间,提高计算效率。实现一个能进行稀疏矩阵基本运算的运算器。 以“带行逻辑链接信息“的三元组顺序表示稀疏矩阵,实现两个矩阵相加、相减和相乘运算。稀疏矩阵的输入采用三元组表示,而运算结果的矩阵则以通常阵列形式列出。

2012-01-14

spring管理struts的action的代码

spring管理struts的action的代码 从类路径下加载spring的配置文件, 多个配置文件可以用逗号和空格区分 * classpath: 关键字特指类路径下加载

2012-01-14

android.开发书籍

android.开发书籍,指导学习Android

2012-01-11

运动会(C语言链表实现)

一、题目介绍: 参加运动会的n个学校编号为1~n。比赛分成m个男子项目和w个女子项目,项目编号分别为1~m和m+1~m+w。由于各项目参加人数差别较大。 允许用户指定项目采取其他名次取法或指定有些项目取前五名,得分顺序为7,5,3,2,1;还有些项目只取前三名,得分顺序为5,3,2。 输入项目编号,学校编号,名次,选手姓名及其性别 输出团体总分报表:显示学校编号,男子团体总分、女子团体总分和团体总分。 二、概要设计: 使用链式存储,数据域使用结构体,内容包括:项目编号,学校编号,名次,所获名次选手及性别。使用输入信息函数,处理数据函数,创建头结点函数。

2012-01-11

[Android.游戏开发入门](美)Mario.Zechner

适用于Android的游戏开发人员,基础入门,游戏开发的准备基础

2011-11-29

学用Java编程

java编程基础 及其应用,从不懂到精通 从简单到实际开发

2011-10-08

java初学者试题

java初学者适宜,有较简单的算法,个别包,类的运用

2011-10-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除