More than code

More Than Code
The efficiency of your iteration of reading, practicing and thinking decides your understanding of the world.
未分类

Real-Time Analytical Processing with SQL Server

最近偶然才读到了这篇paper,不得不说sql server还是太先进了,当时的设计影响了后面系统的决策。给出了一份比较好的,从传统数据库集成AP能力的答卷。 这篇文章是sql server在2014版本引入列存的能力后,在2016版本继续强化列存能力的方法,核心有4大块: * 支持在in-memory table上增加列式的二级索引 * 列式二级索引支持更新 * 在主索引是列式索引的时候,支持增加btree索引作为二级索引 * 列式扫描的性能优化 上面这几点支持的能力虽然看上去没有什么太值得关注的,但实际上sql…

2024年12月7日 0条评论 185点热度 0人点赞 sheep 阅读全文
未分类

从零构建向量数据库 Notes

最近买了一本《从零构建向量数据库》读了一下,这里简单记录一些笔记。 TLDR: 我感觉整体内容不多,尤其是我比较关注的向量算法/存储格式各种相关的地方。但是这本书讲的比较全,抛去向量的地方,还有挺多周边的工作,但是和向量关联都不大了。 整体来说适合刚对数据库有一定了解的人读一读,如果对这块比较熟悉的话,基本上就不用看了,或者速度一下2H也够了。 chp2 向量数据库的发展受益于深度学习的发展,让embedding这个技术有了更好的发挥空间 深度学习模型可以比较好的处理非结构化的数据(通过转化成embedding),…

2024年12月6日 1条评论 304点热度 2人点赞 sheep 阅读全文
未分类

GraphRAG V2 Notes

最近又重新看了看graphrag相关的一些东西,简单整理点内容。 目前能用的开源框架,graphrag相关的,除了ms的graphrag之外,还有ragflow,以及dbgpt。这里简单介绍一下他们graphrag的实现方式: RagFlow ragflow有多种类型的解析方法,比如paper/book等,然后KG是专门的一种,代码在rag/app/knowledge_graph.py里 index.py:build_knowledge_graph_chunks 看注释里基本流程是和ms的graphrag是一样的 …

2024年12月1日 0条评论 206点热度 0人点赞 sheep 阅读全文
未分类

Through the Looking Glass 16 Years Later

前文:OLTP Through the Looking Glass, and What We Found There中的结论: 给出了当时paper的缺陷: * 只计算了dbms的cycle,而非整个server的。 * remote communication没有计算。但remote communication开销比较大。 * 这里就是全链路观测/优化的思想。 * 深入点,解决问题如果有更加高的视角,就更容易发现瓶颈点,从而更高效的优化。这也是为什么要有高层次视角看问题。 然后在voltdb上跑了个有partit…

2024年10月20日 0条评论 291点热度 0人点赞 sheep 阅读全文
未分类

Amazon MemoryDB Notes

对MemoryDB的paper做一些总结 要了解做MemoryDB的目的,需要先明白原本的redis有哪些问题,那么首先要了解下redis 摘自原文中的redis的一些特点: * redis支持200+ commands,10种数据结构,包括hash table, sorted sets, stream, hyperloglogs等 * command可以被组合起来成为group,并有原子执行的能力 * redis支持水平拓展,通过crc16把key space编码成16384个slot。并把这些slot分布到若干…

2024年10月2日 0条评论 330点热度 2人点赞 sheep 阅读全文
database

Efficient query processing with efficient offset value encoding

Introduction Goetz哥最近出了一本新书: More Modern Btree Techniques,里面多次提到了有关Btree/排序结构的压缩技术,比较关键的一个就是offset value encoding,并且也提到了Google的Napa/F1 Query使用了这种技术来加速查询。这篇文章就来介绍一下offset value encoding具体是怎么做的,以及这个技术如何能够加速查询。 在介绍Offset Value Encoding之前,先大概了解一下他的基本思路,Goetz哥在老版本的…

2024年9月25日 0条评论 299点热度 1人点赞 sheep 阅读全文
未分类

More Modern B-Tree Techniques Notes

最近新出了一本书,是Modern B-Tree Techniques的续集,More Modern B-Tree Techniques。这里做一下简单的总结。 后面打算整理一下Btree相关技术,写一篇文章,会总结一下这本书,前作,一些相关的Paper,以及一些工业界的Btree实现。 TLDR tldr版,整体来说,我感觉书中细节的内容不多,基本上就是概括一下几个方向的技术,这里大概总结了一下,然后列了一些我觉得值得关注的paper: - btree结构,可能关注的点 - Write optimized btre…

2024年9月8日 0条评论 357点热度 0人点赞 sheep 阅读全文
未分类

Colossus Notes

three main building blocks: * Colossus is our cluster-level file system, successor to the Google File System (GFS). * Spanner is our globally-consistent, scalable relational database. * Borg is a scalable job scheduler that launches everything from compute to …

2024年8月3日 0条评论 326点热度 0人点赞 sheep 阅读全文
未分类

Draft--On Designing Storage-Disaggregated Databases

最近有一个新开源的仓库openaurora,以及对应的paper《Understanding the Performance Implications of the Design Principles in Storage-Disaggregated Databases》,讲了讲存算分离数据库的一些设计点,以及这些设计点的带来的效果。 周末有时间简单读了读,也引发了一些思考,这里就简单提一些我个人认为存算分离数据库的一些设计点吧。这里整体写的比较琐碎,可能后面会再写一个更加体系化的文章,提高下阅读体验。 论文整体的…

2024年7月28日 0条评论 344点热度 0人点赞 sheep 阅读全文
未分类

推理服务器折腾记录

从淘宝上搞得超微7048GR X99 双电源。 * 这里我以为是多一个电源可以多2000w,多更多的线。但实际上服务器发过来才发现这两个电源貌似是为容灾设计的,比如一个电源跪了,可以在不停机的情况下,动态切换新的电源。然后电源出来的接口还是那些。所以如果想搞4个8 + 8pin的显卡的话,还是需要自己搞6pin转8pin的转接线,然后每一个显卡都用一个8pin,一个6转8。 CPU是挑的便宜的,E5-2680 V4 两个 内存是三星32G DDR4 4个共计128G。后面估计还会拓展到256G * 插内存的时候记得…

2024年7月28日 0条评论 345点热度 1人点赞 sheep 阅读全文
1…34567…29
分类
  • ARTS
  • C++
  • CSAPP
  • daily
  • database
  • leetcode
  • linux
  • ml
  • nlp
  • paper
  • rocksdb
  • rust
  • ScummVM
  • tech
  • 其他
  • 周报
  • 未分类
  • 笔记
  • 算法
  • 计算机图形学
归档
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 10 月
  • 2024 年 9 月
  • 2024 年 8 月
  • 2024 年 7 月
  • 2024 年 6 月
  • 2024 年 5 月
  • 2024 年 4 月
  • 2024 年 3 月
  • 2024 年 2 月
  • 2023 年 12 月
  • 2023 年 11 月
  • 2023 年 9 月
  • 2023 年 7 月
  • 2023 年 6 月
  • 2023 年 5 月
  • 2023 年 4 月
  • 2023 年 2 月
  • 2023 年 1 月
  • 2022 年 9 月
  • 2022 年 7 月
  • 2022 年 6 月
  • 2022 年 5 月
  • 2022 年 4 月
  • 2022 年 3 月
  • 2022 年 2 月
  • 2022 年 1 月
  • 2021 年 12 月
  • 2021 年 11 月
  • 2021 年 10 月
  • 2021 年 9 月
  • 2021 年 8 月
  • 2021 年 7 月
  • 2021 年 6 月
  • 2021 年 5 月
  • 2021 年 4 月
  • 2021 年 3 月
  • 2021 年 1 月
  • 2020 年 12 月

COPYRIGHT © 2021 heavensheep.xyz. ALL RIGHTS RESERVED.

THEME KRATOS MADE BY VTROIS