返回系列
Series Detail

RAG实战14 篇文章

按系列顺序整理的完整文章列表,适合从第一篇一路读到最后。

1
理一下RAG流程,实

理一下RAG流程,实现一个demo

这里暂时还没有摘要,但文章里藏着完整的思考。

2
RAG_FileLo

RAG_FileLoader

实现加载文件的逻辑

3
embedder

embedder

将切割的文档转化为向量,供后续的向量数据库使用

4
chunker

chunker

语义分块器,根据语义切割文本块

5
vector

vector

向量数据库管理器

6
封装RAG问答cha

封装RAG问答chain

组装检索器、Prompt 和 LLM,实现端到端的问答功能

7
跑通一下流程

跑通一下流程

在控制台跑一下RAG问答

8
QueryRewri

QueryRewriter 多路查询

实现多种查询重写策略来提升检索召回率: - 多路查询生成 - HyDE (假设文档嵌入) - 查询扩展

9
混合检索 bm25+

混合检索 bm25+向量检索

实现 BM25 关键词检索和向量检索的混合策略

10
reranker 重

reranker 重排序模块

使用 Cross-Encoder 模型对检索结果进行精细化重排序

11
稍微复杂点的chai

稍微复杂点的chain

串起 多路查询,混合检索,重排序,父子索引

12
前后查询对比

前后查询对比

对比使用,混合检索+重排序的结果

13
优化尝试,父子索引

优化尝试,父子索引

父子索引关联更多相关chunk

14
单独处理md的chu

单独处理md的chunk分割,注入更多metadata

重新处理md文件的分割和元数据