More than code

More Than Code
The efficiency of your iteration of reading, practicing and thinking decides your understanding of the world.
paper

Percolator Tutorial

Percolator Tutorial Percolator是google推出的用来做增量计算的系统,主要用来替换MapReduce在Google Indexing System中的作用 这里我们只关注Percolator中的事务模型 前置知识: * 2PC - 保证跨分区事务的原子提交 * Bigtable - 底层存储,可以看作是分布式KVS * MVOCC - 并发控制算法 Bigtable Bigtable是Google基于GFS的一个存储系统 不看容错的话,就是一个LSM-Tree 和现代KVS不同的是,…

2022年5月25日 0条评论 462点热度 0人点赞 sheep 阅读全文
paper

Don't Hold My Data Hostage - A Case For Client Protocol Redesign

Don't Hold My Data Hostage - A Case For Client Protocol Redesign Abstract 我感觉之后我还是把摘要整个写一下 从数据库传输大量的数据到客户端是一个相当昂贵的操作。这个传输时间可以很容易就占有整个语句执行时间的主导部分。这对于一些外部数据分析的工具来说是一个很大的影响。在这篇论文中,我们将分析并探索将结果集序列化的设计空间。通过实现表明现有的方法都会有性能不足的情况。然后我们提出了一种列式的序列化方法。 (我猜测是不是通过列式存储提高压缩率,从而…

2022年5月24日 0条评论 385点热度 0人点赞 sheep 阅读全文
paper

Constant Time Recovery in Azure SQL Database

Constant Time Recovery in Azure SQL Database Abstract 这个恢复机制结合了ARIES和MVCC,从而实现了常数时间的恢复。 允许连续的log trucation,从而减少了日志空间的使用量,即使是有长事务的存在(对比Innodb,如果Undo table用完了就不能开新的事务了) 对于云数据库(Cloud database,应该是DBaaS)来说,这个能力是相当重要的,因为: 1. 数据库大小是不断增加的 2. 对于commodity hardware来说,fai…

2022年5月18日 0条评论 573点热度 0人点赞 sheep 阅读全文
paper

Integrating Compress and Execution in Column-Oriented Database Systems

Integrating Compress and Execution in Column-Oriented Database Systems Abstract 列存储的数据库可以提高相邻数据项之间的相似度,从而带来更好的压缩效果。 压缩的最好方式不仅取决于数据的属性,还取决于查询的workload(sql workload) Introduction 列存压缩的一个优势就是我们可以在压缩的数据上直接应用算子,从而提高CPU的性能。对于RLE(游程编码)来说,比如他把数据压缩成(42,1000),表示有1000个值为…

2022年5月10日 0条评论 460点热度 0人点赞 sheep 阅读全文
paper

Optimal Column Layout for Hybrid Workloads notes

Optimal Column Layout for Hybrid Workloads Abstract 现代的analytical system是基于列存储。然后通过delta store来进行插入和更新 我们通过确定分区的数量,他们的大小和范围,以及缓冲区大小以及他们是如何分配的来组织数据的分布。 给出workload knowledge以及performance requirements,给出一个优化的物理布局 Introduction 目前的系统对于数据的布局都是固定的,这意味着他们会被局限在某个地方,而不能…

2022年4月30日 0条评论 484点热度 0人点赞 sheep 阅读全文
paper

A Comparison of Adaptive Radix Trees and Hash Tables notes

A Comparison of Adaptive Radix Trees and Hash Tables Abstract 比较ART, Judy Array, 两种基于二次探测哈希的变体,三种Cuckoo Hashing的变体 结果发现ART和Judy都不能与哈希方法相比 Introduction 这里提到了这里的比较只用于integer: We only focus on keys from an integer domain. In this regard, we would like to point ou…

2022年4月28日 0条评论 760点热度 0人点赞 sheep 阅读全文
paper

Building a Bw-Tree Takes More Than Just Buzz Words notes

Building a Bw-Tree Takes More Than Just Buzz Words 两个贡献,一个是Bw-Tree的实现教程,并且提出了新的优化策略。第二个则是发现BwTree并不如其他使用锁的并发数据结构更快 Introduction Lock-free的数据结构实现的难点: 1. 需要明白所有的race conditions 2. 并发线程的同步点通常不会放到算法中,导致人们实现出错,最后变成了busy-waiting loop 3. 需要保证所有的读者全部离开后才能回收内存(在mit os中…

2022年4月26日 0条评论 743点热度 0人点赞 sheep 阅读全文
paper

Fast Serializable MVCC

introduction里就是一些对MVCC的介绍。不过最后他提了一点我觉得比较关键 Careful engineering, however, matters as the performance of version maintenance greatly affects transaction and query processing. Main Contribution: 1. 低开销的MVCC implementation 2. 基于Precision Locking的变体的一种串行化的方法 3. 一种s…

2022年4月24日 0条评论 592点热度 0人点赞 sheep 阅读全文
paper

Scalable Garbage Collection for In-Memory MVCC Systems

Abstract 他首先提出HTAP workload中,GC通常会成为bottleneck 现有的GC技术过于粗粒度。并且不能很好的处理sudden spike的workload Introduction MVCC的一个问题就是如果workload中有很多的long-running transactions,那么活跃的版本就会增加的非常快,并且我们不能删除掉这些版本因为他们可能要被活跃事务使用 所以这些long-running transaction就会导致一个恶性循环 因为他们持续的越久,那么活跃的版本就越多,…

2022年4月24日 0条评论 528点热度 0人点赞 sheep 阅读全文
paper

Session Guarantees For Weak Consistent Replicated Data -- notes

这个paper提出了session guarantee从而可以避免弱一致性级别带来的问题,同时还可以保持弱隔离级别的优势 A session is an abstraction for the sequence of read and write operations performed during the execution of an application 提出session的目的不是为了和事务对应(事务是用来保证ACID的),session的目的则是为了给用户提供一个一致性的视角。 贴一下原文:Sessi…

2022年4月21日 0条评论 477点热度 0人点赞 sheep 阅读全文
1…1112131415…28
分类
  • ARTS
  • C++
  • CSAPP
  • daily
  • database
  • leetcode
  • linux
  • ml
  • nlp
  • paper
  • rocksdb
  • rust
  • ScummVM
  • tech
  • 其他
  • 周报
  • 未分类
  • 笔记
  • 算法
  • 计算机图形学
归档
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 10 月
  • 2024 年 9 月
  • 2024 年 8 月
  • 2024 年 7 月
  • 2024 年 6 月
  • 2024 年 5 月
  • 2024 年 4 月
  • 2024 年 3 月
  • 2024 年 2 月
  • 2023 年 12 月
  • 2023 年 11 月
  • 2023 年 9 月
  • 2023 年 7 月
  • 2023 年 6 月
  • 2023 年 5 月
  • 2023 年 4 月
  • 2023 年 2 月
  • 2023 年 1 月
  • 2022 年 9 月
  • 2022 年 7 月
  • 2022 年 6 月
  • 2022 年 5 月
  • 2022 年 4 月
  • 2022 年 3 月
  • 2022 年 2 月
  • 2022 年 1 月
  • 2021 年 12 月
  • 2021 年 11 月
  • 2021 年 10 月
  • 2021 年 9 月
  • 2021 年 8 月
  • 2021 年 7 月
  • 2021 年 6 月
  • 2021 年 5 月
  • 2021 年 4 月
  • 2021 年 3 月
  • 2021 年 1 月
  • 2020 年 12 月

COPYRIGHT © 2021 heavensheep.xyz. ALL RIGHTS RESERVED.

THEME KRATOS MADE BY VTROIS