More than code

More Than Code
The efficiency of your iteration of reading, practicing and thinking decides your understanding of the world.
Agent/RAG

RAG Techniques

Claude帮忙写的,对应这个项目:https://github.com/NirDiamant/RAG_Techniques?tab=readme-ov-file 概述 本文档基于对RAG_Techniques仓库的深入分析,详细介绍了34种先进的检索增强生成(Retrieval-Augmented Generation, RAG)技术。这些技术涵盖了从基础实现到高级架构的全方位解决方案,旨在提升RAG系统的准确性、效率和上下文丰富度。 技术分类 🌱 基础技术 1. 简单RAG (Simple RAG) 核心原理:…

2025年7月27日 0条评论 311点热度 0人点赞 sheep 阅读全文
database

The Five-Minute Rule for the Cloud Caching in Analytics Systems

看到了大佬的文章:https://zhuanlan.zhihu.com/p/1932613410174014236 学习了一番然后来简单总结一下。感兴趣的可以去这个知乎的文章里看,材料更加完善 核心点还是设计系统的决策点是跟着这些基础设施的能力走的: * 多核bulabula * memory便宜,ssd随机读写变快bulabula的 因为之前的five minute rule是基于存储层次来设计的,内存->磁盘,上层的延迟/带宽是大于下一层的。而在云上的S3虽然延迟大,但是带宽也大,也比较便宜。 所以在设计的时候…

2025年7月27日 0条评论 266点热度 0人点赞 sheep 阅读全文
RL

Sarsa vs Q-learning

图片下方文字解释了Sarsa和Q-learning在悬崖行走(Cliff Walking)问题中的表现差异,并指出Sarsa更“保守”。这里说的“保守”主要是指Sarsa在学习过程中倾向于选择更安全的路径,避免风险。 以下是Sarsa更保守的原因: On-policy (在策略) 学习: Sarsa 是一种 on-policy (在策略) 学习算法。这意味着它在更新Q值时,是基于当前策略选择的下一个动作 A' 来进行评估的。换句话说,Sarsa在学习过程中会“说一套做一套”,它用实际执行的动作序列来更新Q值。 具体…

2025年7月26日 0条评论 217点热度 0人点赞 sheep 阅读全文
RL

RL 基础篇

初探 强化学习用智能体(agent)这个概念来表示做决策的机器。相比于有监督学习中的“模型”,强化学习中的“智能体”强调机器不但可以感知周围的环境信息,还可以通过做决策来直接改变这个环境,而不只是给出一些预测信号。 面向决策任务的强化学习和面向预测任务的有监督学习在形式上是有不少区别的。首先,决策任务往往涉及多轮交互,即序贯决策;而预测任务总是单轮的独立任务。如果决策也是单轮的,那么它可以转化为“判别最优动作”的预测任务。其次,因为决策任务是多轮的,智能体就需要在每轮做决策时考虑未来环境相应的改变,所以当前轮带来最…

2025年7月26日 0条评论 231点热度 0人点赞 sheep 阅读全文
未分类

Set Rerank

这块主要是提一下最近看到的一些RAG技术中,针对问答全面性做的一些优化: Shifting from Ranking to Set Selection for Retrieval Augmented Generation 这里是做的instruction turning,所以就不扣技术了,主要就是他的idea: * 不是去关注单个文档/chunk和问答的相关性,而是看整体的覆盖率。 * 避免召回了很多语意相似得分很高的chunk,反而无法全面的回答问题 Knowledge-Aware Diverse Reranki…

2025年7月19日 0条评论 258点热度 0人点赞 sheep 阅读全文
未分类

Gemini fullstack langgraph

google前一阵开源了一个用langgraph实现的deep research https://github.com/google-gemini/gemini-fullstack-langgraph-quickstart 对应到代码中也很简单: 看一下实现细节,是否有需要特殊关注的点: generate_query 根据用户历史对话,用LLM生成若干个search query 有option控制query count,会传入一下当前时间 continue_to_web_research 把输入的search qu…

2025年7月12日 0条评论 255点热度 0人点赞 sheep 阅读全文
未分类

KumoRFM

Kumo的使用方式在这边有一个简单的例子:https://colab.research.google.com/drive/1WOyMm8gdT1lwrmgRjJUSwb940sn6jUM4#scrollTo=z6FzaBV6jZAY 基本流程是: * 用户导入数据表,Kumo会把关系型数据转化成图数据: * 每一行是一个实体 * 行与行的外键约束就是边。就是表示Join * 用户通过PQL提交查询,比如: * PREDICT LIST_DISTINCT(transaction.StockCode, 0, 7, da…

2025年5月25日 0条评论 402点热度 0人点赞 sheep 阅读全文
未分类

ChatTS

字节发了一个新的reasearch paper在vldb25上: ChatTS: Aligning Time Series with LLMs via Synthetic Data for Enhanced Understanding and Reasoning 支持时序数据这个模态的大模型,可能也可以叫做time serise foundation model 之所以需要让模型原生支持读取时序数据,是因为现在模型对时序数据的输入支持比较差,需要直接把具体的数值输入进去,个人理解这里有两个问题: * 模型对数字的感…

2025年5月24日 0条评论 409点热度 0人点赞 sheep 阅读全文
未分类

neon for ai

这周公司邀请了大佬来分享一下neon的一些场景,针对AI这块,neon的优势主要有几点: * serveless,秒级别拉起服务 * PITR,事务级别的状态闪回 * branching,可写快照 分享的时候演示的neon功能毫无疑问是非常强的,这里主要想来看看这几个功能对应的具体的需求到底是什么 serveless这个 可能是用户希望快速拉起一个数据库做测试,这个其实理由并不是很强,因为SQL lite等一些本地数据库在使用上应该相对来说更加方便。 希望是针对PG做快速拉起,比如希望利用pg vector以及数据…

2025年5月18日 0条评论 331点热度 0人点赞 sheep 阅读全文
未分类

GraphGen

知乎有一篇文章,可以拿来参考: * https://zhuanlan.zhihu.com/p/1899069273533581204 论文要解决的问题 论文旨在解决大语言模型(LLM)监督微调(SFT)中高质量监督数据稀缺的问题。现有合成数据生成方法存在事实错误、长尾知识覆盖不足、知识结构简单化和输出同质化等缺陷,尤其在闭卷知识密集型问答任务中表现不佳。GraphGen通过知识图谱引导的合成数据生成,提升数据质量。 前人研究现状 基于知识图谱(KG)的方法:早期依赖人工模板生成,存在多样性差的问题;后续引入RNN等…

2025年5月18日 0条评论 335点热度 0人点赞 sheep 阅读全文
12345…31
分类
  • Agent/RAG
  • ARTS
  • C++
  • CSAPP
  • daily
  • database
  • leetcode
  • linux
  • ml
  • nlp
  • paper
  • RL
  • rocksdb
  • rust
  • ScummVM
  • tech
  • 其他
  • 周报
  • 未分类
  • 笔记
  • 算法
  • 计算机图形学
归档
  • 2025 年 12 月
  • 2025 年 11 月
  • 2025 年 10 月
  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 10 月
  • 2024 年 9 月
  • 2024 年 8 月
  • 2024 年 7 月
  • 2024 年 6 月
  • 2024 年 5 月
  • 2024 年 4 月
  • 2024 年 3 月
  • 2024 年 2 月
  • 2023 年 12 月
  • 2023 年 11 月
  • 2023 年 9 月
  • 2023 年 7 月
  • 2023 年 6 月
  • 2023 年 5 月
  • 2023 年 4 月
  • 2023 年 2 月
  • 2023 年 1 月
  • 2022 年 9 月
  • 2022 年 7 月
  • 2022 年 6 月
  • 2022 年 5 月
  • 2022 年 4 月
  • 2022 年 3 月
  • 2022 年 2 月
  • 2022 年 1 月
  • 2021 年 12 月
  • 2021 年 11 月
  • 2021 年 10 月
  • 2021 年 9 月
  • 2021 年 8 月
  • 2021 年 7 月
  • 2021 年 6 月
  • 2021 年 5 月
  • 2021 年 4 月
  • 2021 年 3 月
  • 2021 年 1 月
  • 2020 年 12 月

COPYRIGHT © 2021 heavensheep.xyz. ALL RIGHTS RESERVED.

THEME KRATOS MADE BY VTROIS