这篇文章来看一下MS GraphRAG是怎么实现增量更新的。核心的代码在:https://github.com/microsoft/graphrag/blob/main/graphrag/index/run/run_pipeline.py 入口在run_pipeline中,参数is_update_run,表示本次写入是增量还是全量 run_pipeline get_delta_docs,这里是根据之前存储中的文档过滤一下,只处理新生成的文档。这里是根据title做的过滤,而非md5什么的。一般来说这里的title就…