代码结构 Chunk ChunkFactory.py,通过decorator注册chunking method * chunking_by_seperators * 定义了一些default text separator(如果希望自定义应该怎么做?传入不同的参数?) * chunking_by_token_size 有一个通用的DocChunk类,用来包装不同的chunking method。他会吃config中的chunk_method。 也负责做Chunk的存储和读取。 * build_chunks * 输入为…