![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
学术科研
文章平均质量分 83
CodeLuweir
壁立千仞,无欲则刚!
展开
-
【轨迹压缩】Trajectory Simplification: On Minimizing the Direction-based Error [2015] [VLDB]
现有的基于位置的轨迹压缩算法,虽然能保证距离误差,但不能保证方向,而基于方向的轨迹压缩算法既能保证方向,也能保证距离;原创 2022-11-09 20:50:27 · 617 阅读 · 0 评论 -
【学习笔记】《深度学习与神经网络》——邱锡鹏
一、绪论人工智能的一个子领域神经网络:一种以(人工))神经元为基本单元的模型深度学习:一类机器学习问题,主要解决贡献度分配问题知识结构:路线图:顶会:1.1 人工智能诞生:人工智能这个学科的诞生有着明确的标志性事件,就是1956年的达特茅斯(Dartmouth)会议。在这次会议上,“人工智能” 被提出并作为木研究领域的名称。人工智能=计算机控制+智能行为;人工智能就是要让机器的行为看起来就像是人所表现出的智能行为一样。 ——John McCarthy ( 1927-201原创 2021-12-22 22:42:28 · 8052 阅读 · 3 评论 -
【轨迹压缩】Similarity-Based Compression of GPS Trajectory Data [2013]
论文: Similarity-Based Compression of GPS Trajectory Data原创 2021-12-17 09:11:46 · 710 阅读 · 0 评论 -
【轨迹压缩】 TrajStore: An Adaptive Storage System for Very Large Trajectory Data Sets [2010] [ICDE]
论文:TrajStore: An adaptive storage system for very large trajectory data sets概述TrajStore是一种存储系统,它被设计用来分割轨迹和共同定位在地理和时间上相邻的轨迹段。它将轨迹分割成适合时空区域的子轨迹,并在磁盘上的一个块(或块的集合)中标记关于每个区域的数据。它在这些块上使用自适应的多层次网格来查找空间中的数据。通过这种方式,大多数查询可以通过从磁盘中读取几个块来回答,即使这些块包含来自数百或数千个轨迹的数据;原理多级原创 2021-12-15 14:58:34 · 579 阅读 · 0 评论 -
【读书笔记】《数据压缩入门·下》——柯尔特·麦克安利斯
第九章 数据建模多上下文编码算法背后的基本概念,可以用下面的例子解释:例如,在“典型”的英语文本中,字母“h”平均的出现概率大约是5%。然而,如果当前字母是“t”,那么下一个字母是“h”的概率就会高很多,其出现概率大约为30%,这是因为“th”这样的字母组合在英语中很常见。类似地,字母“u”平均的出现概率大约是2%。而如果当前字母是“q”,那么下一个字母是“u”的可能性则会超过99%。在这个例子中,通过当前字母是“q”,我们就能预测到下一个字母会是“u”,因此可以分配给它更少的二进制位数。这种基于统计观原创 2021-09-14 12:10:47 · 1414 阅读 · 0 评论 -
【读书笔记】《数据压缩入门·中》——柯尔特·麦克安利斯
第六章 自适应统计编码6.1 位置对熵的重要性第5章介绍的所有统计编码算法,在编码开始之前都需要遍历一次数据,以计算出各符号出现的概率。而在计算出整个数据集中各符号的出现概率后,还要继续处理这些数值。如果是相对较小的数据集,那么这些就不是什么问题。然而,随着要压缩的数据集变大,统计编码的结果与熵的偏差也会越来越大,这是因为数据集的不同部分有着不同的概率特征。如果处理的是流数据,比如视频流或音频流,由于整个数据集没有“结尾”,因此就不能“遍历两次”;在数据流中,字符Q可能会在前三分之一部分出现很多次,而原创 2021-09-13 19:41:04 · 1245 阅读 · 0 评论 -
【读书笔记】《数据压缩入门·上》——柯尔特·麦克安利斯
第一章 概述数据压缩算法有5类:变长编码(variable-length codes,VLC)、统计压缩(statistical compression)、字典编码(dictionary encodings)、上下文模型(context modeling)和多上下文模型(multicontext modeling);每类算法的变种在输入数据、算法性能、内存要求以及输出大小方面存在细微的差别。要选出其中最佳的一个算法,需要在准备的数据上测试这些算法,然后找出压缩效果最好的那个。每类算法的变种在输入数据、原创 2021-09-12 23:52:41 · 2135 阅读 · 0 评论 -
【文献阅读】A Randomly Accessible Lossless Compression Scheme for Time-Series Data
主题 标题上也说了,关于对时间序列数据进行压缩的一种对经典重复数据删减的改进版,并能够对压缩后的数据进行随机访问而不用解压缩;动机 目前并不仅仅停留在为了存储而压缩,有时候是为了应用的持续访问,所以设计的方法是针对压缩数据进行持续的低成本随机访问,避免解压缩; 可以看出这种对压缩后数据的随机访问技术该是比较少的,大多是字符串的;作者也很新颖,换了场景,选择单独针对时间序列数据进行分析;创新点对经典的重复数据删除进行改进;让压缩后的数据能够被随机访问,减少存储的同时有利于应用的持续访原创 2021-08-04 15:28:49 · 405 阅读 · 0 评论