More than code

未分类
未分类

ComoRAG & LeanRAG & FromRankToSelection

好久不写了简单看点文章写写: ComoRAG 个人理解就是几种GraphRAG的方法合起来,上面搞了一个Agent混合检索 三层: * 事实层就是类似HippoRAG这种知识图谱用来回答事实性问题的 * 语意层就是总结类,比如RAPTOR,MS GraphRAG * Episodic就是时序类,这里是用滑动窗口做的,感觉可以套一些其他的时序图的方法 这里时序类的做法是把长文本做滑动窗口式的总结,用来回答全文脉络这种问题。个人感觉主要就是针对小说这种场景。或者是放到Memory上,用户对话的每一段搞一个滑动窗口总结。…

2025年8月27日 0条评论 9点热度 0人点赞 sheep 阅读全文
未分类

Set Rerank

这块主要是提一下最近看到的一些RAG技术中,针对问答全面性做的一些优化: Shifting from Ranking to Set Selection for Retrieval Augmented Generation 这里是做的instruction turning,所以就不扣技术了,主要就是他的idea: * 不是去关注单个文档/chunk和问答的相关性,而是看整体的覆盖率。 * 避免召回了很多语意相似得分很高的chunk,反而无法全面的回答问题 Knowledge-Aware Diverse Reranki…

2025年7月19日 0条评论 117点热度 0人点赞 sheep 阅读全文
未分类

Gemini fullstack langgraph

google前一阵开源了一个用langgraph实现的deep research https://github.com/google-gemini/gemini-fullstack-langgraph-quickstart 对应到代码中也很简单: 看一下实现细节,是否有需要特殊关注的点: generate_query 根据用户历史对话,用LLM生成若干个search query 有option控制query count,会传入一下当前时间 continue_to_web_research 把输入的search qu…

2025年7月12日 0条评论 120点热度 0人点赞 sheep 阅读全文
未分类

KumoRFM

Kumo的使用方式在这边有一个简单的例子:https://colab.research.google.com/drive/1WOyMm8gdT1lwrmgRjJUSwb940sn6jUM4#scrollTo=z6FzaBV6jZAY 基本流程是: * 用户导入数据表,Kumo会把关系型数据转化成图数据: * 每一行是一个实体 * 行与行的外键约束就是边。就是表示Join * 用户通过PQL提交查询,比如: * PREDICT LIST_DISTINCT(transaction.StockCode, 0, 7, da…

2025年5月25日 0条评论 235点热度 0人点赞 sheep 阅读全文
未分类

ChatTS

字节发了一个新的reasearch paper在vldb25上: ChatTS: Aligning Time Series with LLMs via Synthetic Data for Enhanced Understanding and Reasoning 支持时序数据这个模态的大模型,可能也可以叫做time serise foundation model 之所以需要让模型原生支持读取时序数据,是因为现在模型对时序数据的输入支持比较差,需要直接把具体的数值输入进去,个人理解这里有两个问题: * 模型对数字的感…

2025年5月24日 0条评论 225点热度 0人点赞 sheep 阅读全文
未分类

neon for ai

这周公司邀请了大佬来分享一下neon的一些场景,针对AI这块,neon的优势主要有几点: * serveless,秒级别拉起服务 * PITR,事务级别的状态闪回 * branching,可写快照 分享的时候演示的neon功能毫无疑问是非常强的,这里主要想来看看这几个功能对应的具体的需求到底是什么 serveless这个 可能是用户希望快速拉起一个数据库做测试,这个其实理由并不是很强,因为SQL lite等一些本地数据库在使用上应该相对来说更加方便。 希望是针对PG做快速拉起,比如希望利用pg vector以及数据…

2025年5月18日 0条评论 190点热度 0人点赞 sheep 阅读全文
未分类

GraphGen

知乎有一篇文章,可以拿来参考: * https://zhuanlan.zhihu.com/p/1899069273533581204 论文要解决的问题 论文旨在解决大语言模型(LLM)监督微调(SFT)中高质量监督数据稀缺的问题。现有合成数据生成方法存在事实错误、长尾知识覆盖不足、知识结构简单化和输出同质化等缺陷,尤其在闭卷知识密集型问答任务中表现不佳。GraphGen通过知识图谱引导的合成数据生成,提升数据质量。 前人研究现状 基于知识图谱(KG)的方法:早期依赖人工模板生成,存在多样性差的问题;后续引入RNN等…

2025年5月18日 0条评论 171点热度 0人点赞 sheep 阅读全文
未分类

Enhancing Cache-Augmented Generation (CAG) with Adaptive Contextual Compression for Scalable Knowledge Integration

论文问题与解答 1. 论文要解决的是什么样的问题? 论文旨在解决大规模语言模型在处理知识密集型任务时面临的上下文窗口容量限制与动态知识管理的挑战。具体来说,Cache-Augmented Generation (CAG) 方法虽然通过预加载知识减少检索延迟,但难以应对大规模或频繁更新的知识库,且固定上下文窗口无法高效管理信息的相关性。 2. 前人是怎么研究这个问题的,现在水平如何? Retrieval-Augmented Generation (RAG):通过动态检索外部文档提升生成准确性,但存在延迟高、噪声敏感和…

2025年5月18日 0条评论 160点热度 0人点赞 sheep 阅读全文
未分类

OpenMemoryMCP

https://docs.mem0.ai/openmemory/overview Mem0这边推出了一个用来管理memory的MCP server,应该是希望通过这套接口统一一下Memory相关场景的接口。 文档中写了他的特点: * Cross-Client Memory Access * Store context in Cursor and retrieve it later in Claude or Windsurf without repeating yourself. * Fully Local Memo…

2025年5月18日 0条评论 230点热度 0人点赞 sheep 阅读全文
未分类

Agent-as-a-Judge

agent as a judge这个框架本身是用来评估代码生成agent的效果的,并且提出了名为DevAI的测试集,用来评测AI开发任务的效果 https://deepwiki.com/metauto-ai/agent-as-a-judge/2-usage-guide 现成的codebase中,主要有3个feature可以用: * ask anything * 用自然语言去query codebase * agent evaluation * 使用AaaJ来评估developer agent的效果。这里有两种方式,…

2025年5月12日 0条评论 202点热度 0人点赞 sheep 阅读全文
12345…9
分类
  • Agent/RAG
  • ARTS
  • C++
  • CSAPP
  • daily
  • database
  • leetcode
  • linux
  • ml
  • nlp
  • paper
  • RL
  • rocksdb
  • rust
  • ScummVM
  • tech
  • 其他
  • 周报
  • 未分类
  • 笔记
  • 算法
  • 计算机图形学
归档
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 10 月
  • 2024 年 9 月
  • 2024 年 8 月
  • 2024 年 7 月
  • 2024 年 6 月
  • 2024 年 5 月
  • 2024 年 4 月
  • 2024 年 3 月
  • 2024 年 2 月
  • 2023 年 12 月
  • 2023 年 11 月
  • 2023 年 9 月
  • 2023 年 7 月
  • 2023 年 6 月
  • 2023 年 5 月
  • 2023 年 4 月
  • 2023 年 2 月
  • 2023 年 1 月
  • 2022 年 9 月
  • 2022 年 7 月
  • 2022 年 6 月
  • 2022 年 5 月
  • 2022 年 4 月
  • 2022 年 3 月
  • 2022 年 2 月
  • 2022 年 1 月
  • 2021 年 12 月
  • 2021 年 11 月
  • 2021 年 10 月
  • 2021 年 9 月
  • 2021 年 8 月
  • 2021 年 7 月
  • 2021 年 6 月
  • 2021 年 5 月
  • 2021 年 4 月
  • 2021 年 3 月
  • 2021 年 1 月
  • 2020 年 12 月

COPYRIGHT © 2021 heavensheep.xyz. ALL RIGHTS RESERVED.

THEME KRATOS MADE BY VTROIS