| Knowledge Graph (KG) |
知識圖譜 |
由實體與關係構成的結構化知識表示,本文核心主題 |
| Knowledge Graph Extraction |
知識圖譜抽取 |
從非結構化文本中自動建構知識圖譜的任務 |
| GraphRAG |
圖譜檢索增強生成 |
使用階層式社群偵測演算法自動發現實體叢集的架構 |
| Retrieval Augmented Generation (RAG) |
檢索增強生成 |
結合檢索與生成的系統,需要結構完整性與語意一致性 |
| Entity Disambiguation |
實體消歧 |
同一實體以不同措辭出現時的辨識問題 |
| Coreference Resolution |
指代消解 |
將同一實體的不同提及連結到單一節點 |
| Named Entity Recognition (NER) |
命名實體辨識 |
可框架化為 token 層級分類,辨識人名、組織、日期等 |
| Relation Extraction |
關係抽取 |
找出實體之間明確連結的任務 |
| Entity Recognition |
實體辨識 |
辨識並分類關鍵文字片段(人物、組織、日期等) |
| Discriminative Models |
判別式模型 |
具雙向注意力、以遮罩語言建模訓練,擅長分類任務 |
| Generative Models |
生成式模型 |
透過機率生成文本,易產生幻覺但可用提示適應 |
| Hallucination |
幻覺 |
模型生成看似合理但虛假的實體與關係 |
| Masked Language Modelling |
遮罩語言建模 |
判別式模型的訓練方式 |
| Bidirectional Attention |
雙向注意力 |
判別式模型的架構特性,利於序列分類 |
| Token Classification |
Token 分類 |
將 NER 視為輸入序列上的 token 層級分類 |
| In-Context Learning |
脈絡內學習 |
生成式模型透過提示與少樣本範例適應,無需額外訓練 |
| Few-Shot Examples |
少樣本範例 |
用於引導生成式模型的提示範例 |
| Asserted Knowledge Graph |
斷言知識圖譜 |
僅含原文明確陳述資訊的可驗證真值圖譜 |
| Ground Truth |
真值/標準答案 |
直接來自原始文本、可驗證的正確知識 |
| Link Prediction |
連結預測 |
在既有實體間推斷缺失關係以增加圖譜連通性 |
| Knowledge Base Alignment |
知識庫對齊 |
將實體正規化對應到更廣泛的知識庫 |
| Entity Linking |
實體連結 |
訓練模型將實體對應至知識庫的模型 |
| Triples |
三元組 |
[實體A — 關係 — 實體B] 的知識表示單位 |
| Taxonomic Augmentation |
分類學擴增 |
加入「is a」「part of」等階層關係組織實體 |
| Rule-Based Augmentation |
規則式擴增 |
以邏輯規則(含多跳推理)從既有模式推斷新事實 |
| Multi-Hop Rules |
多跳規則 |
串連推理以提升圖譜連通性並揭示隱含關係 |
| Hierarchical Community Detection |
階層式社群偵測 |
GraphRAG 用以在多重粒度自動發現實體叢集 |
| LangExtract |
LangExtract |
Google 推出、由 Gemini 驅動的段落層級資訊抽取函式庫 |
| GNN (Graph Neural Network) |
圖神經網路 |
下游分類任務所用的圖譜模型 |