More than code

More Than Code
The efficiency of your iteration of reading, practicing and thinking decides your understanding of the world.
未分类

cook notes 01

记录一下菜谱,以及一些可能的关键点: 煎牛肉饼 不用油煎 放到锅里后,先煎一面让牛肉饼定型,然后再翻面 用中火/小火就行 红烧排骨 先把排骨解冻,用盐水泡20分钟,把血析出来。盐不用放非常多 葱白半根就够,切葱段 蒜大概1个,切蒜片 姜半个,切姜片 大料2/3个,香叶4/5片 烧一壶开水备用 放一锅开水,把刚刚的排骨捞出来放进去 切少数的姜片和葱叶,放到锅中和排骨一起煮 等到水烧开,锅中会有排骨的血凝固起来的物质(应该是蛋白什么的) 这一步主要的目的是把血去干净,否则排骨会有腥味 把排骨捞出来,注意避开凝固的蛋白。…

2024年12月8日 0条评论 201点热度 0人点赞 sheep 阅读全文
未分类

Real-Time Analytical Processing with SQL Server

最近偶然才读到了这篇paper,不得不说sql server还是太先进了,当时的设计影响了后面系统的决策。给出了一份比较好的,从传统数据库集成AP能力的答卷。 这篇文章是sql server在2014版本引入列存的能力后,在2016版本继续强化列存能力的方法,核心有4大块: * 支持在in-memory table上增加列式的二级索引 * 列式二级索引支持更新 * 在主索引是列式索引的时候,支持增加btree索引作为二级索引 * 列式扫描的性能优化 上面这几点支持的能力虽然看上去没有什么太值得关注的,但实际上sql…

2024年12月7日 0条评论 214点热度 0人点赞 sheep 阅读全文
未分类

从零构建向量数据库 Notes

最近买了一本《从零构建向量数据库》读了一下,这里简单记录一些笔记。 TLDR: 我感觉整体内容不多,尤其是我比较关注的向量算法/存储格式各种相关的地方。但是这本书讲的比较全,抛去向量的地方,还有挺多周边的工作,但是和向量关联都不大了。 整体来说适合刚对数据库有一定了解的人读一读,如果对这块比较熟悉的话,基本上就不用看了,或者速度一下2H也够了。 chp2 向量数据库的发展受益于深度学习的发展,让embedding这个技术有了更好的发挥空间 深度学习模型可以比较好的处理非结构化的数据(通过转化成embedding),…

2024年12月6日 1条评论 380点热度 2人点赞 sheep 阅读全文
未分类

GraphRAG V2 Notes

最近又重新看了看graphrag相关的一些东西,简单整理点内容。 目前能用的开源框架,graphrag相关的,除了ms的graphrag之外,还有ragflow,以及dbgpt。这里简单介绍一下他们graphrag的实现方式: RagFlow ragflow有多种类型的解析方法,比如paper/book等,然后KG是专门的一种,代码在rag/app/knowledge_graph.py里 index.py:build_knowledge_graph_chunks 看注释里基本流程是和ms的graphrag是一样的 …

2024年12月1日 0条评论 241点热度 0人点赞 sheep 阅读全文
未分类

Through the Looking Glass 16 Years Later

前文:OLTP Through the Looking Glass, and What We Found There中的结论: 给出了当时paper的缺陷: * 只计算了dbms的cycle,而非整个server的。 * remote communication没有计算。但remote communication开销比较大。 * 这里就是全链路观测/优化的思想。 * 深入点,解决问题如果有更加高的视角,就更容易发现瓶颈点,从而更高效的优化。这也是为什么要有高层次视角看问题。 然后在voltdb上跑了个有partit…

2024年10月20日 0条评论 316点热度 0人点赞 sheep 阅读全文
未分类

Amazon MemoryDB Notes

对MemoryDB的paper做一些总结 要了解做MemoryDB的目的,需要先明白原本的redis有哪些问题,那么首先要了解下redis 摘自原文中的redis的一些特点: * redis支持200+ commands,10种数据结构,包括hash table, sorted sets, stream, hyperloglogs等 * command可以被组合起来成为group,并有原子执行的能力 * redis支持水平拓展,通过crc16把key space编码成16384个slot。并把这些slot分布到若干…

2024年10月2日 0条评论 359点热度 2人点赞 sheep 阅读全文
database

Efficient query processing with efficient offset value encoding

Introduction Goetz哥最近出了一本新书: More Modern Btree Techniques,里面多次提到了有关Btree/排序结构的压缩技术,比较关键的一个就是offset value encoding,并且也提到了Google的Napa/F1 Query使用了这种技术来加速查询。这篇文章就来介绍一下offset value encoding具体是怎么做的,以及这个技术如何能够加速查询。 在介绍Offset Value Encoding之前,先大概了解一下他的基本思路,Goetz哥在老版本的…

2024年9月25日 0条评论 332点热度 1人点赞 sheep 阅读全文
未分类

More Modern B-Tree Techniques Notes

最近新出了一本书,是Modern B-Tree Techniques的续集,More Modern B-Tree Techniques。这里做一下简单的总结。 后面打算整理一下Btree相关技术,写一篇文章,会总结一下这本书,前作,一些相关的Paper,以及一些工业界的Btree实现。 TLDR tldr版,整体来说,我感觉书中细节的内容不多,基本上就是概括一下几个方向的技术,这里大概总结了一下,然后列了一些我觉得值得关注的paper: - btree结构,可能关注的点 - Write optimized btre…

2024年9月8日 0条评论 390点热度 0人点赞 sheep 阅读全文
未分类

Colossus Notes

three main building blocks: * Colossus is our cluster-level file system, successor to the Google File System (GFS). * Spanner is our globally-consistent, scalable relational database. * Borg is a scalable job scheduler that launches everything from compute to …

2024年8月3日 0条评论 355点热度 0人点赞 sheep 阅读全文
未分类

Draft--On Designing Storage-Disaggregated Databases

最近有一个新开源的仓库openaurora,以及对应的paper《Understanding the Performance Implications of the Design Principles in Storage-Disaggregated Databases》,讲了讲存算分离数据库的一些设计点,以及这些设计点的带来的效果。 周末有时间简单读了读,也引发了一些思考,这里就简单提一些我个人认为存算分离数据库的一些设计点吧。这里整体写的比较琐碎,可能后面会再写一个更加体系化的文章,提高下阅读体验。 论文整体的…

2024年7月28日 0条评论 372点热度 0人点赞 sheep 阅读全文
1…34567…29
分类
  • ARTS
  • C++
  • CSAPP
  • daily
  • database
  • leetcode
  • linux
  • ml
  • nlp
  • paper
  • rocksdb
  • rust
  • ScummVM
  • tech
  • 其他
  • 周报
  • 未分类
  • 笔记
  • 算法
  • 计算机图形学
归档
  • 2025 年 7 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 10 月
  • 2024 年 9 月
  • 2024 年 8 月
  • 2024 年 7 月
  • 2024 年 6 月
  • 2024 年 5 月
  • 2024 年 4 月
  • 2024 年 3 月
  • 2024 年 2 月
  • 2023 年 12 月
  • 2023 年 11 月
  • 2023 年 9 月
  • 2023 年 7 月
  • 2023 年 6 月
  • 2023 年 5 月
  • 2023 年 4 月
  • 2023 年 2 月
  • 2023 年 1 月
  • 2022 年 9 月
  • 2022 年 7 月
  • 2022 年 6 月
  • 2022 年 5 月
  • 2022 年 4 月
  • 2022 年 3 月
  • 2022 年 2 月
  • 2022 年 1 月
  • 2021 年 12 月
  • 2021 年 11 月
  • 2021 年 10 月
  • 2021 年 9 月
  • 2021 年 8 月
  • 2021 年 7 月
  • 2021 年 6 月
  • 2021 年 5 月
  • 2021 年 4 月
  • 2021 年 3 月
  • 2021 年 1 月
  • 2020 年 12 月

COPYRIGHT © 2021 heavensheep.xyz. ALL RIGHTS RESERVED.

THEME KRATOS MADE BY VTROIS