| Knowledge Graph |
知識圖譜 |
以實體間關係連結事實的結構化知識表示,全文核心主題 |
| RDF (Resource Description Framework) |
資源描述框架 |
W3C 標準,用 subject–predicate–object 三元組描述資源間關係 |
| Subject–Predicate–Object Triple |
主詞–謂詞–受詞三元組 |
RDF 表達關係的基本單位,predicate 描述主受詞之間的關係 |
| Predicate |
謂詞 |
三元組中描述兩實體之間關係類型的部分 |
| Entity Extraction |
實體抽取 |
在抽取關係前先辨識文本中被連結的「事物」 |
| Entity Linking / Entity Resolution |
實體連結 / 實體消歧 |
將「IBM」「International Business Machines」等同指對象合併為單一實體 |
| Relation Extraction |
關係抽取 |
從文本中辨識並抽出實體間關係的整體任務 |
| OpenIE (Open Information Extraction) |
開放式資訊抽取 |
無需預先定義關係類型即可抽出關係三元組,用於關係發現 |
| Supervised Relation Extraction |
監督式關係抽取 |
以標註樣本訓練模型預測 acquiredBy、locatedIn 等關係 |
| Distant Supervision |
遠程監督 |
用既有知識庫(如 Freebase)自動生成訓練樣本,減少人工標註 |
| LLM-Assisted Extraction |
LLM 輔助抽取 |
用大型語言模型抽取隱含關係並將自然語句正規化為標準謂詞 |
| Candidate Generation |
候選生成 |
LLM 在抽取流程中產生待驗證關係候選的階段 |
| Predicate Normalization |
謂詞正規化 |
將語意相同的多種關係措辭收斂為受控詞彙(controlled vocabulary) |
| Competency Questions |
能力問題 |
本體與知識圖譜設計中定義圖譜須能回答的問題清單 |
| Ontology |
本體論 |
定義領域中實體、關係與規則的形式化結構 |
| Provenance |
來源溯源 |
記錄關係來自何處、如何產生,對應 W3C PROV-O 規範 |
| SHACL (Shapes Constraint Language) |
形狀約束語言 |
W3C 標準,依 shapes 條件驗證 RDF 圖譜 |
| Schema.org |
Schema.org 詞彙 |
標準化實體與關係描述的詞彙,可用 RDFa、Microdata、JSON-LD 表達 |
| JSON-LD |
JSON 連結資料 |
結構化資料格式,Google 推薦用於網頁標記 |
| Centrality Algorithms |
中心性演算法 |
Neo4j GDS 提供 PageRank、degree、closeness、betweenness、eigenvector 等用於辨識重要節點 |
| Dependency Parsing |
依存句法剖析 |
規則式抽取中分析句子文法結構以辨識關係的方法 |