More than code

More Than Code
The efficiency of your iteration of reading, practicing and thinking decides your understanding of the world.
paper

GentleRain tutorial

GentleRain tutorial 首先要知道最简单的causal consistency是怎么实现的 在论文Session Guarantees For Weak Consistent Replicated Data中有详细的说明 每一个更新都附带一个version vector,当远端数据中心的version vector大于这个更新的version vector的时候,这个更新才能被安装到远端数据库中。从而保证因果一致性。 下一个问题,当数据中心内进行数据分区的时候,我们要怎么处理? 每个分区内部都维护一…

2022年5月26日 0条评论 491点热度 0人点赞 sheep 阅读全文
paper

GentleRain: Cheap and Scalable Causal Consistency with Physical Clocks

GentleRain: Cheap and Scalable Causal Consistency with Physical Clocks Abstract GentleRain是geo-replicated data store,提供因果一致性 GentleRain用periodic aggregation protocol来决定更新是否能被其他人看到 GentleRain通过一个标量的时间戳来实现因果一致性。时间戳是从loosely synchronized physical clocks导出的,时钟漂移不会…

2022年5月26日 0条评论 460点热度 0人点赞 sheep 阅读全文
paper

Percolator Tutorial

Percolator Tutorial Percolator是google推出的用来做增量计算的系统,主要用来替换MapReduce在Google Indexing System中的作用 这里我们只关注Percolator中的事务模型 前置知识: * 2PC - 保证跨分区事务的原子提交 * Bigtable - 底层存储,可以看作是分布式KVS * MVOCC - 并发控制算法 Bigtable Bigtable是Google基于GFS的一个存储系统 不看容错的话,就是一个LSM-Tree 和现代KVS不同的是,…

2022年5月25日 0条评论 470点热度 0人点赞 sheep 阅读全文
paper

Don't Hold My Data Hostage - A Case For Client Protocol Redesign

Don't Hold My Data Hostage - A Case For Client Protocol Redesign Abstract 我感觉之后我还是把摘要整个写一下 从数据库传输大量的数据到客户端是一个相当昂贵的操作。这个传输时间可以很容易就占有整个语句执行时间的主导部分。这对于一些外部数据分析的工具来说是一个很大的影响。在这篇论文中,我们将分析并探索将结果集序列化的设计空间。通过实现表明现有的方法都会有性能不足的情况。然后我们提出了一种列式的序列化方法。 (我猜测是不是通过列式存储提高压缩率,从而…

2022年5月24日 0条评论 398点热度 0人点赞 sheep 阅读全文
paper

Constant Time Recovery in Azure SQL Database

Constant Time Recovery in Azure SQL Database Abstract 这个恢复机制结合了ARIES和MVCC,从而实现了常数时间的恢复。 允许连续的log trucation,从而减少了日志空间的使用量,即使是有长事务的存在(对比Innodb,如果Undo table用完了就不能开新的事务了) 对于云数据库(Cloud database,应该是DBaaS)来说,这个能力是相当重要的,因为: 1. 数据库大小是不断增加的 2. 对于commodity hardware来说,fai…

2022年5月18日 0条评论 581点热度 0人点赞 sheep 阅读全文
paper

Integrating Compress and Execution in Column-Oriented Database Systems

Integrating Compress and Execution in Column-Oriented Database Systems Abstract 列存储的数据库可以提高相邻数据项之间的相似度,从而带来更好的压缩效果。 压缩的最好方式不仅取决于数据的属性,还取决于查询的workload(sql workload) Introduction 列存压缩的一个优势就是我们可以在压缩的数据上直接应用算子,从而提高CPU的性能。对于RLE(游程编码)来说,比如他把数据压缩成(42,1000),表示有1000个值为…

2022年5月10日 0条评论 470点热度 0人点赞 sheep 阅读全文
分类
  • ARTS
  • C++
  • CSAPP
  • daily
  • database
  • leetcode
  • linux
  • ml
  • nlp
  • paper
  • rocksdb
  • rust
  • ScummVM
  • tech
  • 其他
  • 周报
  • 未分类
  • 笔记
  • 算法
  • 计算机图形学
归档
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 10 月
  • 2024 年 9 月
  • 2024 年 8 月
  • 2024 年 7 月
  • 2024 年 6 月
  • 2024 年 5 月
  • 2024 年 4 月
  • 2024 年 3 月
  • 2024 年 2 月
  • 2023 年 12 月
  • 2023 年 11 月
  • 2023 年 9 月
  • 2023 年 7 月
  • 2023 年 6 月
  • 2023 年 5 月
  • 2023 年 4 月
  • 2023 年 2 月
  • 2023 年 1 月
  • 2022 年 9 月
  • 2022 年 7 月
  • 2022 年 6 月
  • 2022 年 5 月
  • 2022 年 4 月
  • 2022 年 3 月
  • 2022 年 2 月
  • 2022 年 1 月
  • 2021 年 12 月
  • 2021 年 11 月
  • 2021 年 10 月
  • 2021 年 9 月
  • 2021 年 8 月
  • 2021 年 7 月
  • 2021 年 6 月
  • 2021 年 5 月
  • 2021 年 4 月
  • 2021 年 3 月
  • 2021 年 1 月
  • 2020 年 12 月

COPYRIGHT © 2021 heavensheep.xyz. ALL RIGHTS RESERVED.

THEME KRATOS MADE BY VTROIS