關鍵術語對照表¶

英文	繁中譯名	文章中的脈絡 / 簡短說明
Retrieval Augmented Generation (RAG)	檢索增強生成	將外部資料源檢索到的資訊提供給 LLM 以「接地」其生成答案；本質為「搜尋 + LLM 提示」
Transformer Encoder	Transformer 編碼器	用來將文字 chunk 嵌入成向量的模型，負責 embedding 與檢索品質
Chunking	切塊 / 分塊	在不破壞語意的前提下將文件切成適當大小的片段，chunk size 是關鍵參數
Vector embeddings	向量嵌入	將文字 chunk 轉成向量以做語意相似度搜尋（如 bge-large、E5、ada-002）
Cosine distance	餘弦距離	衡量 query 向量與 chunk 向量語意接近程度的度量
Approximate Nearest Neighbours (ANN)	近似最近鄰	大規模向量檢索的高效演算法，含分群、樹狀結構、HNSW
HNSW	階層可導航小世界圖	一種高效的近似最近鄰索引演算法
Vector store / index	向量儲存 / 向量索引	儲存向量化內容的搜尋索引（faiss、nmslib、annoy、Pinecone、Weaviate、Chroma）
Hierarchical indices	階層式索引	建立摘要索引與 chunk 索引兩層，先篩選相關文件再深入搜尋
HyDE (Hypothetical Document Embeddings)	假設性文件嵌入	讓 LLM 先生成假設答案，用其向量強化搜尋品質
Sentence Window Retrieval	句子視窗檢索	以單句嵌入精準檢索，再向前後擴展 k 句作為 LLM 的脈絡
Auto-merging / Parent Document Retriever	自動合併 / 父文件檢索器	檢索較小 child chunk，命中多個同 parent 時合併為 parent chunk
Fusion retrieval / Hybrid search	融合檢索 / 混合搜尋	結合關鍵字稀疏檢索（BM25、tf-idf）與向量語意搜尋
BM25	BM25	業界標準的關鍵字稀疏檢索演算法
Reciprocal Rank Fusion (RRF)	倒數排名融合	將不同相似度分數的檢索結果重排合併的演算法
Reranking / Cross-encoder	重排序 / 交叉編碼器	對檢索結果做精排，cross-encoder 將 query 與 chunk 配對打分
Query transformation	查詢轉換	用 LLM 改寫/分解使用者輸入（sub-query 分解、step-back prompting、query re-writing）以提升檢索
Query Routing	查詢路由	由 LLM 決策選擇要走的索引、資料源或子鏈/代理
Agentic behaviour / Agents	代理行為 / 智能代理	賦予具推理能力的 LLM 一組工具與任務（如 Multi-Document Agents、ReAct Agent）
Function calling API	函式呼叫 API	OpenAI Assistants 能將自然語言轉為對外部工具或資料庫的 API 呼叫
Response synthesiser	回應合成器	RAG 最後一步，依據檢索脈絡與查詢生成答案（迭代精煉、摘要、多答案合併）
RA-DIT (Retrieval Augmented Dual Instruction Tuning)	檢索增強雙指令微調	Meta AI 提出，於 query/context/answer 三元組上同時微調 LLM 與 Retriever
RAG triad	RAG 三元評估	評估指標：檢索脈絡相關性、groundedness（接地性）、答案相關性
Faithfulness / Groundedness	忠實度 / 接地性	衡量生成答案受所提供脈絡支持程度的評估指標（Ragas、TruLens）
Mean Reciprocal Rank (MRR)	平均倒數排名	常見搜尋引擎評估指標，亦用於 RAG 檢索評估