| Retrieval Augmented Generation (RAG) |
檢索增強生成 |
將外部資料源檢索到的資訊提供給 LLM 以「接地」其生成答案;本質為「搜尋 + LLM 提示」 |
| Transformer Encoder |
Transformer 編碼器 |
用來將文字 chunk 嵌入成向量的模型,負責 embedding 與檢索品質 |
| Chunking |
切塊 / 分塊 |
在不破壞語意的前提下將文件切成適當大小的片段,chunk size 是關鍵參數 |
| Vector embeddings |
向量嵌入 |
將文字 chunk 轉成向量以做語意相似度搜尋(如 bge-large、E5、ada-002) |
| Cosine distance |
餘弦距離 |
衡量 query 向量與 chunk 向量語意接近程度的度量 |
| Approximate Nearest Neighbours (ANN) |
近似最近鄰 |
大規模向量檢索的高效演算法,含分群、樹狀結構、HNSW |
| HNSW |
階層可導航小世界圖 |
一種高效的近似最近鄰索引演算法 |
| Vector store / index |
向量儲存 / 向量索引 |
儲存向量化內容的搜尋索引(faiss、nmslib、annoy、Pinecone、Weaviate、Chroma) |
| Hierarchical indices |
階層式索引 |
建立摘要索引與 chunk 索引兩層,先篩選相關文件再深入搜尋 |
| HyDE (Hypothetical Document Embeddings) |
假設性文件嵌入 |
讓 LLM 先生成假設答案,用其向量強化搜尋品質 |
| Sentence Window Retrieval |
句子視窗檢索 |
以單句嵌入精準檢索,再向前後擴展 k 句作為 LLM 的脈絡 |
| Auto-merging / Parent Document Retriever |
自動合併 / 父文件檢索器 |
檢索較小 child chunk,命中多個同 parent 時合併為 parent chunk |
| Fusion retrieval / Hybrid search |
融合檢索 / 混合搜尋 |
結合關鍵字稀疏檢索(BM25、tf-idf)與向量語意搜尋 |
| BM25 |
BM25 |
業界標準的關鍵字稀疏檢索演算法 |
| Reciprocal Rank Fusion (RRF) |
倒數排名融合 |
將不同相似度分數的檢索結果重排合併的演算法 |
| Reranking / Cross-encoder |
重排序 / 交叉編碼器 |
對檢索結果做精排,cross-encoder 將 query 與 chunk 配對打分 |
| Query transformation |
查詢轉換 |
用 LLM 改寫/分解使用者輸入(sub-query 分解、step-back prompting、query re-writing)以提升檢索 |
| Query Routing |
查詢路由 |
由 LLM 決策選擇要走的索引、資料源或子鏈/代理 |
| Agentic behaviour / Agents |
代理行為 / 智能代理 |
賦予具推理能力的 LLM 一組工具與任務(如 Multi-Document Agents、ReAct Agent) |
| Function calling API |
函式呼叫 API |
OpenAI Assistants 能將自然語言轉為對外部工具或資料庫的 API 呼叫 |
| Response synthesiser |
回應合成器 |
RAG 最後一步,依據檢索脈絡與查詢生成答案(迭代精煉、摘要、多答案合併) |
| RA-DIT (Retrieval Augmented Dual Instruction Tuning) |
檢索增強雙指令微調 |
Meta AI 提出,於 query/context/answer 三元組上同時微調 LLM 與 Retriever |
| RAG triad |
RAG 三元評估 |
評估指標:檢索脈絡相關性、groundedness(接地性)、答案相關性 |
| Faithfulness / Groundedness |
忠實度 / 接地性 |
衡量生成答案受所提供脈絡支持程度的評估指標(Ragas、TruLens) |
| Mean Reciprocal Rank (MRR) |
平均倒數排名 |
常見搜尋引擎評估指標,亦用於 RAG 檢索評估 |