这块主要是提一下最近看到的一些RAG技术中,针对问答全面性做的一些优化: Shifting from Ranking to Set Selection for Retrieval Augmented Generation 这里是做的instruction turning,所以就不扣技术了,主要就是他的idea: * 不是去关注单个文档/chunk和问答的相关性,而是看整体的覆盖率。 * 避免召回了很多语意相似得分很高的chunk,反而无法全面的回答问题 Knowledge-Aware Diverse Reranki…