More than code - To Everyone Working Toward Good. KumoRFM

Kumo的使用方式在这边有一个简单的例子:https://colab.research.google.com/drive/1WOyMm8gdT1lwrmgRjJUSwb940sn6jUM4#scrollTo=z6FzaBV6jZAY 基本流程是： * 用户导入数据表，Kumo会把关系型数据转化成图数据： * 每一行是一个实体 * 行与行的外键约束就是边。就是表示Join * 用户通过PQL提交查询，比如： * PREDICT LIST_DISTINCT(transaction.StockCode, 0, 7, da…

2025年5月25日 0条评论 305点热度 0人点赞 sheep 阅读全文

字节发了一个新的reasearch paper在vldb25上： ChatTS: Aligning Time Series with LLMs via Synthetic Data for Enhanced Understanding and Reasoning 支持时序数据这个模态的大模型，可能也可以叫做time serise foundation model 之所以需要让模型原生支持读取时序数据，是因为现在模型对时序数据的输入支持比较差，需要直接把具体的数值输入进去，个人理解这里有两个问题： * 模型对数字的感…

2025年5月24日 0条评论 304点热度 0人点赞 sheep 阅读全文

这周公司邀请了大佬来分享一下neon的一些场景，针对AI这块，neon的优势主要有几点： * serveless，秒级别拉起服务 * PITR，事务级别的状态闪回 * branching，可写快照分享的时候演示的neon功能毫无疑问是非常强的，这里主要想来看看这几个功能对应的具体的需求到底是什么 serveless这个可能是用户希望快速拉起一个数据库做测试，这个其实理由并不是很强，因为SQL lite等一些本地数据库在使用上应该相对来说更加方便。希望是针对PG做快速拉起，比如希望利用pg vector以及数据…

2025年5月18日 0条评论 257点热度 0人点赞 sheep 阅读全文

知乎有一篇文章，可以拿来参考： * https://zhuanlan.zhihu.com/p/1899069273533581204 论文要解决的问题论文旨在解决大语言模型（LLM）监督微调（SFT）中高质量监督数据稀缺的问题。现有合成数据生成方法存在事实错误、长尾知识覆盖不足、知识结构简单化和输出同质化等缺陷，尤其在闭卷知识密集型问答任务中表现不佳。GraphGen通过知识图谱引导的合成数据生成，提升数据质量。前人研究现状基于知识图谱（KG）的方法：早期依赖人工模板生成，存在多样性差的问题；后续引入RNN等…

2025年5月18日 0条评论 242点热度 0人点赞 sheep 阅读全文

论文问题与解答 1. 论文要解决的是什么样的问题？论文旨在解决大规模语言模型在处理知识密集型任务时面临的上下文窗口容量限制与动态知识管理的挑战。具体来说，Cache-Augmented Generation (CAG) 方法虽然通过预加载知识减少检索延迟，但难以应对大规模或频繁更新的知识库，且固定上下文窗口无法高效管理信息的相关性。 2. 前人是怎么研究这个问题的，现在水平如何？ Retrieval-Augmented Generation (RAG)：通过动态检索外部文档提升生成准确性，但存在延迟高、噪声敏感和…

2025年5月18日 0条评论 227点热度 0人点赞 sheep 阅读全文

https://docs.mem0.ai/openmemory/overview Mem0这边推出了一个用来管理memory的MCP server，应该是希望通过这套接口统一一下Memory相关场景的接口。文档中写了他的特点： * Cross-Client Memory Access * Store context in Cursor and retrieve it later in Claude or Windsurf without repeating yourself. * Fully Local Memo…

2025年5月18日 0条评论 311点热度 0人点赞 sheep 阅读全文

agent as a judge这个框架本身是用来评估代码生成agent的效果的，并且提出了名为DevAI的测试集，用来评测AI开发任务的效果 https://deepwiki.com/metauto-ai/agent-as-a-judge/2-usage-guide 现成的codebase中，主要有3个feature可以用： * ask anything * 用自然语言去query codebase * agent evaluation * 使用AaaJ来评估developer agent的效果。这里有两种方式，…

2025年5月12日 0条评论 276点热度 0人点赞 sheep 阅读全文

PocketFlow的作者基于PocketFlow做了一个用来给Codebase生成文档的项目，算是简化版本的DeepWiki，这里介绍一下基本思路核心代码就在nodes.py中看deepwiki的流程图，这里的node都是串行执行的： IdentifyAbstractions 是把整个codebase丢给LLM，给的格式是文件目录，文件内容的tuple 输出若干个abstraction，对应的解释，以及相关的文件索引输出格式是YAML 为了避免模型输出文件路径出问题，这里是让他输出文件路径对应的index，…

2025年5月11日 0条评论 280点热度 0人点赞 sheep 阅读全文

一个极简的Agent框架，核心点在于定义了节点的执行逻辑和转移逻辑中文的可以看看这个 https://www.zhihu.com/question/1898055391348238271/answer/1898075972873491235 框架 Node 节点之间通过share store通信 * prep是从share store中获取数据 * exec是执行 * post是写回share store node还提供了一些retry + fallback的逻辑 Flow 看一个例子就行这里revise >>…

2025年5月11日 0条评论 253点热度 0人点赞 sheep 阅读全文

PolyG: Effective and Efficient GraphRAG with Adaptive Graph Traversal 论文介绍《PolyG: Effective and Efficient GraphRAG with Adaptive Graph Traversal》提出了一种自适应的图遍历策略，用于增强基于知识图谱的检索增强生成（GraphRAG）系统。传统的GraphRAG方法采用固定的图遍历策略（如广度优先搜索或随机游走），但不同问题类型需要不同的遍历策略，导致生成答案的质量和效率受限…

2025年4月7日 0条评论 386点热度 0人点赞 sheep 阅读全文

1 234 5…31

KumoRFM

ChatTS

neon for ai

GraphGen

Enhancing Cache-Augmented Generation (CAG) with Adaptive Contextual Compression for Scalable Knowledge Integration

OpenMemoryMCP

Agent-as-a-Judge

PocketFlow-Codebase Knowledge

PocketFlow

PolyG: Effective and Efficient GraphRAG with Adaptive Graph Traversal