| Graph RAG / GraphRAG |
圖譜檢索增強生成 |
不把文字塞進向量庫靠語意相似度檢索,而是建立知識圖譜並在查詢時對圖譜進行檢索 |
| Knowledge Graph |
知識圖譜 |
由實體與其關係構成的結構化網絡,作為檢索基礎 |
| Entity-Relation Triple |
實體—關係三元組 |
從原始文字抽取出的結構化單元,如 (Tesla, headquartered_in, Austin) |
| Entity Extraction / Detection |
實體抽取/偵測 |
從文字中找出實體,本文指其「大致已解決」(Entity F1 0.78–0.91) |
| Relation Extraction |
關係抽取 |
抽取實體間關係並組成三元組,本文指出這是真正的瓶頸 |
| Vector Store |
向量資料庫 |
傳統 RAG 儲存文字 chunk 並以語意相似度檢索的方式 |
| Local / Open-Weight LLM |
本地/開放權重大型語言模型 |
因資料不能離開基礎設施,需在自有 GPU 上運行的 7–9B 模型 |
| Triple F1 |
三元組 F1 分數 |
衡量三元組抽取品質的核心指標,最佳僅 0.732 |
| Entity F1 |
實體 F1 分數 |
衡量實體偵測品質的指標 |
| Schema Conformance |
結構符合度 |
模型是否產出有效可解析(符合 schema)的輸出之比率 |
| Few-Shot Prompting |
少樣本提示 |
在提示中附上數個範例,提升品質但降低可靠度且拉長 context |
| Schema-in-Prompt |
提示內附結構 |
在指令中附上完整 JSON schema,本文推薦為最佳預設策略 |
| Fuzzy Matching |
模糊匹配 |
評估管線中容忍語意等價差異的比對方法 |
| Token-Sort Ratio |
詞元排序比率 |
實體匹配採用、閾值設 75 的字串相似度演算法 |
| Predicate Canonicalization |
謂詞正規化 |
將語意等價的關係名(約 75 組同義詞)映射為同一意義 |
| Snake_case Predicate |
蛇形命名謂詞 |
benchmark 期望的簡潔謂詞格式,與模型產出的冗長自然語言謂詞不符 |
| Fine-Tuning / SFT |
微調/監督式微調 |
以監督範例教模型穩定產出結構化抽取 |
| QLoRA |
量化低秩適配微調 |
4-bit 量化基礎權重加 LoRA adapter,於消費級 GPU 上微調 |
| LoRA Adapter (r=64, alpha=128) |
低秩適配器 |
加在 attention 與前饋投影層上的可訓練參數 |
| REBEL |
REBEL 關係抽取資料集 |
Babelscape 以 Wikipedia 對齊 Wikidata 製作的銀標三元組資料集 |
| Silver-Labeled Dataset |
銀標資料集 |
自動對齊產生(非人工黃金標註)的訓練資料 |
| Knowledge Base Completion |
知識庫補全 |
「這些實體有哪些已知事實」的抽取取向(REBEL 的取向) |
| Text-Grounded Relation Extraction |
文本根據的關係抽取 |
「這段文字實際表達哪些關係」的抽取取向,更適合 Graph RAG |
| User-Turn Masking |
使用者輪次遮罩 |
訓練損失只計算助理輸出(JSON),聚焦抽取任務 |
| Sequence Packing |
序列打包 |
將多個短樣本打包進單一序列以提升 GPU 利用率 |
| vLLM |
vLLM 推論引擎 |
用於模型推論的服務框架 |