跳轉到

關鍵術語對照表

英文 繁中譯名 文章中的脈絡 / 簡短說明
Retrieval Augmented Generation (RAG) 檢索增強生成 將外部資料源檢索到的資訊提供給 LLM 以「接地」其生成答案;本質為「搜尋 + LLM 提示」
Transformer Encoder Transformer 編碼器 用來將文字 chunk 嵌入成向量的模型,負責 embedding 與檢索品質
Chunking 切塊 / 分塊 在不破壞語意的前提下將文件切成適當大小的片段,chunk size 是關鍵參數
Vector embeddings 向量嵌入 將文字 chunk 轉成向量以做語意相似度搜尋(如 bge-large、E5、ada-002)
Cosine distance 餘弦距離 衡量 query 向量與 chunk 向量語意接近程度的度量
Approximate Nearest Neighbours (ANN) 近似最近鄰 大規模向量檢索的高效演算法,含分群、樹狀結構、HNSW
HNSW 階層可導航小世界圖 一種高效的近似最近鄰索引演算法
Vector store / index 向量儲存 / 向量索引 儲存向量化內容的搜尋索引(faiss、nmslib、annoy、Pinecone、Weaviate、Chroma)
Hierarchical indices 階層式索引 建立摘要索引與 chunk 索引兩層,先篩選相關文件再深入搜尋
HyDE (Hypothetical Document Embeddings) 假設性文件嵌入 讓 LLM 先生成假設答案,用其向量強化搜尋品質
Sentence Window Retrieval 句子視窗檢索 以單句嵌入精準檢索,再向前後擴展 k 句作為 LLM 的脈絡
Auto-merging / Parent Document Retriever 自動合併 / 父文件檢索器 檢索較小 child chunk,命中多個同 parent 時合併為 parent chunk
Fusion retrieval / Hybrid search 融合檢索 / 混合搜尋 結合關鍵字稀疏檢索(BM25、tf-idf)與向量語意搜尋
BM25 BM25 業界標準的關鍵字稀疏檢索演算法
Reciprocal Rank Fusion (RRF) 倒數排名融合 將不同相似度分數的檢索結果重排合併的演算法
Reranking / Cross-encoder 重排序 / 交叉編碼器 對檢索結果做精排,cross-encoder 將 query 與 chunk 配對打分
Query transformation 查詢轉換 用 LLM 改寫/分解使用者輸入(sub-query 分解、step-back prompting、query re-writing)以提升檢索
Query Routing 查詢路由 由 LLM 決策選擇要走的索引、資料源或子鏈/代理
Agentic behaviour / Agents 代理行為 / 智能代理 賦予具推理能力的 LLM 一組工具與任務(如 Multi-Document Agents、ReAct Agent)
Function calling API 函式呼叫 API OpenAI Assistants 能將自然語言轉為對外部工具或資料庫的 API 呼叫
Response synthesiser 回應合成器 RAG 最後一步,依據檢索脈絡與查詢生成答案(迭代精煉、摘要、多答案合併)
RA-DIT (Retrieval Augmented Dual Instruction Tuning) 檢索增強雙指令微調 Meta AI 提出,於 query/context/answer 三元組上同時微調 LLM 與 Retriever
RAG triad RAG 三元評估 評估指標:檢索脈絡相關性、groundedness(接地性)、答案相關性
Faithfulness / Groundedness 忠實度 / 接地性 衡量生成答案受所提供脈絡支持程度的評估指標(Ragas、TruLens)
Mean Reciprocal Rank (MRR) 平均倒數排名 常見搜尋引擎評估指標,亦用於 RAG 檢索評估