秦皇岛纫惩金融服务有限公司

首頁 > 數(shù)據(jù)百科 > 技術(shù)人怎么去搭建知識圖譜

技術(shù)人怎么去搭建知識圖譜

2021-08-26 10:25:32   |  Smartbi大數(shù)據(jù)百科 4863

商業(yè)智能BI產(chǎn)品更多介紹:http://www.aobey.com.cn/

商業(yè)智能BI產(chǎn)品更多介紹:點擊前往

    第一步:知識表示與建模&sma&<p>知識表示將現(xiàn)實世界中的各類知識表達成計算機可存儲和計算的結(jié)構(gòu)。機器必須要掌握大量的知識,特別是常識知識才能實現(xiàn)真正類人的智能。</p><p><br/></p><p>目前,隨著自然語言處理領域詞向量等嵌入(Embedding)技術(shù)手段的出現(xiàn),采用連續(xù)向量方式來表示知識的研究(TransE翻譯模型、SME、SLM、NTN、MLP,以及NAM神經(jīng)網(wǎng)絡模型等)正在逐漸取代與上述以符號邏輯為基礎知識表示方法相融合,成為現(xiàn)階段知識表示的研究熱點。更為重要的是,<strong>知識圖譜</strong>嵌入也通常作為一種類型的先驗知識輔助輸入到很多深度神經(jīng)網(wǎng)絡模型中,用來約束和監(jiān)督神經(jīng)網(wǎng)絡的訓練過程</p><p><br/></p><p>相比于傳統(tǒng)人工智能,知識圖譜時代基于向量的知識表示方法不僅能夠以三元組為基礎的較為簡單實用的知識表示方法滿足規(guī)模化擴展的要求,還能夠作為大數(shù)據(jù)分析系統(tǒng)的重要數(shù)據(jù)基礎,幫助這些數(shù)據(jù)更加易于與深度學習模型集成。</p><p><br/></p><p>同時,隨著以深度學習為代表的表示學習的發(fā)展,面向知識圖譜中實體和關(guān)系的表示學習也取得了重要的進展。知識表示學習將實體和關(guān)系表示為稠密的低維向量實現(xiàn)了對實體和關(guān)系的分布式表示,已經(jīng)成為知識圖譜語義鏈接預測和知識補全的重要方法。</p><p><br/></p><p>知識表示學習是近年來的研究熱點,研究者提出了多種模型,學習知識庫中的實體和關(guān)系的表示。不過其中關(guān)系路徑建模工作較為初步,在關(guān)系路徑的可靠性計算、語義組合操作等方面還有很多細致的考察工作需要完成。</p><p><br/></p>

    第二步:知識獲取&sma&<p>知識獲取包括了實體識別與鏈接、實體關(guān)系學習、以及事件知識學習。</p><p><br/></p><p>1、實體識別與鏈接是知識圖譜構(gòu)建、知識補全與知識應用的核心技術(shù),也是海量文本分析的核心技術(shù),為計算機類人推理和自然語言理解提供知識基礎。</p><p>實體識別是文本理解意義的基礎,也就是識別文本中指定類別實體的過程,可以檢測文本中的新實體,并將其加入到現(xiàn)有知識庫中。</p><p><br/></p><p>2、實體關(guān)系識別是知識圖譜自動構(gòu)建和自然語言理解的基礎。實體關(guān)系定義為兩個或多個實體間的某種聯(lián)系,用于描述客觀存在的事物之間的關(guān)聯(lián)關(guān)系。實體關(guān)系學習就是自動從文本中檢測和識別出實體之間具有的某種語義關(guān)系,也稱為關(guān)系抽取。</p><p>實體關(guān)系抽取分為預定義關(guān)系抽取和開放關(guān)系抽取。預定義關(guān)系抽取是指系統(tǒng)所抽取的關(guān)系是預先定義好的,如上下位關(guān)系、國家—首都關(guān)系等。開放式關(guān)系抽取不預先定義抽取的關(guān)系類別,由系統(tǒng)自動從文本中發(fā)現(xiàn)并抽取關(guān)系。</p><p><br/></p><p>3、事件知識學習,就是將非結(jié)構(gòu)化文本中自然語言所表達的事件以結(jié)構(gòu)化的形式呈現(xiàn),對于知識表示、理解、計算和應用意義重大。</p><p>事件是促使事物狀態(tài)和關(guān)系改變的條件,是動態(tài)的、結(jié)構(gòu)化的知識。目前已存在的知識資源(如谷歌知識圖譜)所描述多是實體以及實體之間的關(guān)系,缺乏對事件知識的描述。</p><p><br/></p>

    第三步:知識融合&sma&<p>知識圖譜可以由任何機構(gòu)和個人自由構(gòu)建,其背后的數(shù)據(jù)來源廣泛、質(zhì)量參差不齊,導致它們之間存在多樣性和異構(gòu)性。語義集成的提出就是為了能夠?qū)⒉煌闹R圖譜融合為一個統(tǒng)一、一致、簡潔的形式,為使用不同知識圖譜的應用程序間的交互建立操作性。</p><p><br/></p><p>常用的技術(shù)包括本體匹配(也稱為本體映射)、實力匹配(也稱為實體對齊、對象公指消解)以及知識融合等。</p><p><br/></p><p>一個語義集成的常見流程,主要包括:輸入、預處理、匹配、知識融合和輸出5個環(huán)節(jié)。</p><p>眾包和主動學習等人機協(xié)作方法是目前實例匹配的研究熱點。這些方法雇傭普通用戶,通過付出較小的人工代價來獲得豐富的先驗數(shù)據(jù),從而提高匹配模型的性能。</p><p><br/></p><p>隨著表示學習技術(shù)在諸如圖像、視頻、語言、自然語言處理等領域的成功,一些研究人員開始著手研究面向知識圖譜的表示學習技術(shù),將實體、關(guān)系等轉(zhuǎn)換成一個低維空間中的實質(zhì)向量(即分布式語義表示),并在知識圖譜補全、知識庫問答等應用中取得了不錯的效果。</p><p><br/></p><p>與此同時,近年來強化學習也取得了一些列進展,如何在語義集成中運用強化學習逐漸成為新的動向。</p><p><br/></p>

    第四步:知識圖譜查詢和推理計算&sma&<p>知識圖譜以圖(Graph)的方式來展現(xiàn)實體、事件及其之間的關(guān)系。知識圖譜存儲和查詢研究如何設計有效的存儲模式支持對大規(guī)模圖數(shù)據(jù)的有效管理,實現(xiàn)對知識圖譜中知識高效查詢。</p><p><br/></p><p>知識推理則從給定的知識圖譜推導出新的實體跟實體之間的關(guān)系,在知識計算中具有重要作用,如知識分類、知識校驗、知識鏈接預測與知識補全等。</p><p><br/></p><p>知識圖譜推理可以分為基于符號的推理和基于統(tǒng)計的推理。</p><p>在人工智能的研究中,基于符號的推理一般是基于經(jīng)典邏輯(一階謂詞邏輯或者命題邏輯)或者經(jīng)典邏輯的變異(比如說缺省邏輯)?;诜柕耐评砜梢詮囊粋€已有的知識圖譜推理出新的實體間關(guān)系,可用于建立新知識或者對知識圖譜進行邏輯的沖突檢測。</p><p><br/></p><p>基于統(tǒng)計的方法一般指關(guān)系機器學習方法,即通過統(tǒng)計規(guī)律從知識圖譜中學習到新的實體間關(guān)系。</p><p><br/></p>

文章目錄

第一步:知識表示與建模&sma&<p>知識表示將現(xiàn)實世界中的各類知識表達成計算機可存儲和計算的結(jié)構(gòu)。機器必須要掌握大量的知識,特別是常識知識才能實現(xiàn)真正類人的智能。</p><p><br/></p><p>目前,隨著自然語言處理領域詞向量等嵌入(Embedding)技術(shù)手段的出現(xiàn),采用連續(xù)向量方式來表示知識的研究(TransE翻譯模型、SME、SLM、NTN、MLP,以及NAM神經(jīng)網(wǎng)絡模型等)正在逐漸取代與上述以符號邏輯為基礎知識表示方法相融合,成為現(xiàn)階段知識表示的研究熱點。更為重要的是,<strong>知識圖譜</strong>嵌入也通常作為一種類型的先驗知識輔助輸入到很多深度神經(jīng)網(wǎng)絡模型中,用來約束和監(jiān)督神經(jīng)網(wǎng)絡的訓練過程</p><p><br/></p><p>相比于傳統(tǒng)人工智能,知識圖譜時代基于向量的知識表示方法不僅能夠以三元組為基礎的較為簡單實用的知識表示方法滿足規(guī)模化擴展的要求,還能夠作為大數(shù)據(jù)分析系統(tǒng)的重要數(shù)據(jù)基礎,幫助這些數(shù)據(jù)更加易于與深度學習模型集成。</p><p><br/></p><p>同時,隨著以深度學習為代表的表示學習的發(fā)展,面向知識圖譜中實體和關(guān)系的表示學習也取得了重要的進展。知識表示學習將實體和關(guān)系表示為稠密的低維向量實現(xiàn)了對實體和關(guān)系的分布式表示,已經(jīng)成為知識圖譜語義鏈接預測和知識補全的重要方法。</p><p><br/></p><p>知識表示學習是近年來的研究熱點,研究者提出了多種模型,學習知識庫中的實體和關(guān)系的表示。不過其中關(guān)系路徑建模工作較為初步,在關(guān)系路徑的可靠性計算、語義組合操作等方面還有很多細致的考察工作需要完成。</p><p><br/></p>
第二步:知識獲取&sma&<p>知識獲取包括了實體識別與鏈接、實體關(guān)系學習、以及事件知識學習。</p><p><br/></p><p>1、實體識別與鏈接是知識圖譜構(gòu)建、知識補全與知識應用的核心技術(shù),也是海量文本分析的核心技術(shù),為計算機類人推理和自然語言理解提供知識基礎。</p><p>實體識別是文本理解意義的基礎,也就是識別文本中指定類別實體的過程,可以檢測文本中的新實體,并將其加入到現(xiàn)有知識庫中。</p><p><br/></p><p>2、實體關(guān)系識別是知識圖譜自動構(gòu)建和自然語言理解的基礎。實體關(guān)系定義為兩個或多個實體間的某種聯(lián)系,用于描述客觀存在的事物之間的關(guān)聯(lián)關(guān)系。實體關(guān)系學習就是自動從文本中檢測和識別出實體之間具有的某種語義關(guān)系,也稱為關(guān)系抽取。</p><p>實體關(guān)系抽取分為預定義關(guān)系抽取和開放關(guān)系抽取。預定義關(guān)系抽取是指系統(tǒng)所抽取的關(guān)系是預先定義好的,如上下位關(guān)系、國家—首都關(guān)系等。開放式關(guān)系抽取不預先定義抽取的關(guān)系類別,由系統(tǒng)自動從文本中發(fā)現(xiàn)并抽取關(guān)系。</p><p><br/></p><p>3、事件知識學習,就是將非結(jié)構(gòu)化文本中自然語言所表達的事件以結(jié)構(gòu)化的形式呈現(xiàn),對于知識表示、理解、計算和應用意義重大。</p><p>事件是促使事物狀態(tài)和關(guān)系改變的條件,是動態(tài)的、結(jié)構(gòu)化的知識。目前已存在的知識資源(如谷歌知識圖譜)所描述多是實體以及實體之間的關(guān)系,缺乏對事件知識的描述。</p><p><br/></p>
第三步:知識融合&sma&<p>知識圖譜可以由任何機構(gòu)和個人自由構(gòu)建,其背后的數(shù)據(jù)來源廣泛、質(zhì)量參差不齊,導致它們之間存在多樣性和異構(gòu)性。語義集成的提出就是為了能夠?qū)⒉煌闹R圖譜融合為一個統(tǒng)一、一致、簡潔的形式,為使用不同知識圖譜的應用程序間的交互建立操作性。</p><p><br/></p><p>常用的技術(shù)包括本體匹配(也稱為本體映射)、實力匹配(也稱為實體對齊、對象公指消解)以及知識融合等。</p><p><br/></p><p>一個語義集成的常見流程,主要包括:輸入、預處理、匹配、知識融合和輸出5個環(huán)節(jié)。</p><p>眾包和主動學習等人機協(xié)作方法是目前實例匹配的研究熱點。這些方法雇傭普通用戶,通過付出較小的人工代價來獲得豐富的先驗數(shù)據(jù),從而提高匹配模型的性能。</p><p><br/></p><p>隨著表示學習技術(shù)在諸如圖像、視頻、語言、自然語言處理等領域的成功,一些研究人員開始著手研究面向知識圖譜的表示學習技術(shù),將實體、關(guān)系等轉(zhuǎn)換成一個低維空間中的實質(zhì)向量(即分布式語義表示),并在知識圖譜補全、知識庫問答等應用中取得了不錯的效果。</p><p><br/></p><p>與此同時,近年來強化學習也取得了一些列進展,如何在語義集成中運用強化學習逐漸成為新的動向。</p><p><br/></p>
第四步:知識圖譜查詢和推理計算&sma&<p>知識圖譜以圖(Graph)的方式來展現(xiàn)實體、事件及其之間的關(guān)系。知識圖譜存儲和查詢研究如何設計有效的存儲模式支持對大規(guī)模圖數(shù)據(jù)的有效管理,實現(xiàn)對知識圖譜中知識高效查詢。</p><p><br/></p><p>知識推理則從給定的知識圖譜推導出新的實體跟實體之間的關(guān)系,在知識計算中具有重要作用,如知識分類、知識校驗、知識鏈接預測與知識補全等。</p><p><br/></p><p>知識圖譜推理可以分為基于符號的推理和基于統(tǒng)計的推理。</p><p>在人工智能的研究中,基于符號的推理一般是基于經(jīng)典邏輯(一階謂詞邏輯或者命題邏輯)或者經(jīng)典邏輯的變異(比如說缺省邏輯)?;诜柕耐评砜梢詮囊粋€已有的知識圖譜推理出新的實體間關(guān)系,可用于建立新知識或者對知識圖譜進行邏輯的沖突檢測。</p><p><br/></p><p>基于統(tǒng)計的方法一般指關(guān)系機器學習方法,即通過統(tǒng)計規(guī)律從知識圖譜中學習到新的實體間關(guān)系。</p><p><br/></p>

商業(yè)智能BI資料包

掃碼添加「小麥」領取 >>>

新一代商業(yè)智能BI工具

覆蓋傳統(tǒng)BI、自助BI、現(xiàn)代BI不同發(fā)展階段,滿足企業(yè)數(shù)字化轉(zhuǎn)型的多樣化需求

讓數(shù)據(jù)成為增長引擎,解鎖行業(yè)領先的智能BI實踐方案!

前往下載
Copyright? 廣州思邁特軟件有限公司  粵ICP備11104361號 網(wǎng)站地圖

電話咨詢

售前咨詢
400-878-3819 轉(zhuǎn)1

售后咨詢
400-878-3819 轉(zhuǎn)2
服務時間:工作日9:00-18:00

微信咨詢

添加企業(yè)微信 1V1專屬服務