8 月, 2025 - More than code

deepwiki输出的质量比较好，但是英文的读起来没那么顺畅，GPT帮忙写了个翻译的脚本我个人用的是gemini2.5 flash，可以自行配置。把代码粘贴到油猴中就可以了 // ==UserScript== // @name DeepWiki Instant Translator (EN↔ZH) // @namespace https://chat.openai.com/ // @version 0.1.0 // @description Translate DeepWiki pages on the fly …

2025年8月31日 0条评论 636点热度 0人点赞 sheep 阅读全文

好久不写了简单看点文章写写： ComoRAG 个人理解就是几种GraphRAG的方法合起来，上面搞了一个Agent混合检索三层： * 事实层就是类似HippoRAG这种知识图谱用来回答事实性问题的 * 语意层就是总结类，比如RAPTOR，MS GraphRAG * Episodic就是时序类，这里是用滑动窗口做的，感觉可以套一些其他的时序图的方法这里时序类的做法是把长文本做滑动窗口式的总结，用来回答全文脉络这种问题。个人感觉主要就是针对小说这种场景。或者是放到Memory上，用户对话的每一段搞一个滑动窗口总结。…

2025年8月27日 0条评论 449点热度 0人点赞 sheep 阅读全文

User 为什么在PPO中，还需要取两个suff的min，为什么不直接用clip呢 Gemini 这是一个非常棒的问题，直接触及了PPO-Clip算法设计的核心思想。简单来说，同时保留surr1（未截断项）和surr2（截断项）并取其min，是为了构建一个悲观的、保守的目标函数下界（Pessimistic Bound），从而实现更安全、更稳定的策略更新。只使用clip项是不够的，因为它在某些情况下会破坏学习信号。让我们通过分析优势函数 \hat{A}_t 的正负两种情况来理解这一点：情况…

2025年8月4日 0条评论 641点热度 0人点赞 sheep 阅读全文

DeepWiki翻译

ComoRAG & LeanRAG & FromRankToSelection

PPO