科技文獻語(yǔ)義檢索系統的分類(lèi)與功能特點(diǎn)論文
1 引 言
語(yǔ)義檢索是信息檢索的發(fā)展趨勢, 早在 20 世紀80 年代, 語(yǔ)義檢索的思想就已經(jīng)出現, 并且信息檢索領(lǐng)域已經(jīng)開(kāi)展了相關(guān)研究工作。企業(yè)級的語(yǔ)義搜索引擎近幾年已經(jīng)開(kāi)始應用, 例如 Kosmix 和 等, 特別等讓搜索變得更智慧。百度框計算搜狗知立方代表了國內搜索引擎在該領(lǐng)域的成功實(shí)踐。在文獻信息檢索領(lǐng)域,作為語(yǔ)義檢索系統的典型代表, 做出了開(kāi)創(chuàng )性的工作, 一些面向科技文獻的語(yǔ)義檢索系統不斷出現。
傳統基于關(guān)鍵詞的檢索系統具有一定的局限性,如無(wú)法解決詞匯的模糊性問(wèn)題, 分散在多個(gè)文檔中的相關(guān)信息不容易被發(fā)現等。語(yǔ)義檢索基于含義而不是通過(guò)關(guān)鍵詞匹配尋找用戶(hù)查詢(xún)的答案, 用以實(shí)現實(shí)體檢索、概念檢索、分類(lèi)檢索、關(guān)系查詢(xún)等知識檢索方式來(lái)滿(mǎn)足用戶(hù)的多種信息需求, 使得搜索智能化, 根據用戶(hù)的意圖給出用戶(hù)想要的結果。目前, 語(yǔ)義檢索主要有兩個(gè)方向: 語(yǔ)義網(wǎng)資源的檢索和對于傳統檢索系統的語(yǔ)義擴展。面向科技文獻的語(yǔ)義檢索研究主要偏向于后者, 利用語(yǔ)義技術(shù)改進(jìn)傳統文獻檢索系統,利用敘詞表、主題詞表、本體等知識組織體系實(shí)現語(yǔ)義豐富化, 采用語(yǔ)義標注、自動(dòng)抽取、關(guān)系發(fā)現的文本挖掘技術(shù)從非結構化的文本中發(fā)現細粒度的數據,使得檢索系統更智能化。本文根據文本語(yǔ)義處理程度對科技文獻語(yǔ)義檢索系統進(jìn)行分類(lèi), 提出科技文獻語(yǔ)義檢索系統的基本框架, 并探討科技文獻語(yǔ)義檢索系統的功能特性。
2 科技文獻語(yǔ)義檢索系統分類(lèi)
根據系統的智能化、語(yǔ)義化程度, 將現有科技文獻語(yǔ)義檢索系統分為: 語(yǔ)義查詢(xún)擴展的檢索系統、以概念或實(shí)體為中心的檢索系統、以關(guān)系為中心的檢索系統、面向知識發(fā)現的檢索系統 4 種類(lèi)型。這 4 類(lèi)檢索系統對科技文獻的文本語(yǔ)義化處理程度不同, 檢索系統的智能化和語(yǔ)義化程度也不同, 如圖 1 所示:
【1】
2.1 語(yǔ)義查詢(xún)擴展的檢索系統
語(yǔ)義查詢(xún)擴展的檢索系統在傳統關(guān)鍵詞檢索基礎上, 對檢索詞進(jìn)行處理, 利用受控詞表和本體對檢索詞進(jìn)行擴展。PubMed支持基于 MeSH 的查詢(xún)擴展,也有利用 UMLS 的同義詞對 PubMed 查詢(xún)進(jìn)行擴展,QuExT執行面向概念的查詢(xún)擴展, 檢索結果根據用戶(hù)預先分配給概念類(lèi)別的不同權重進(jìn)行排序。
GO2PUB利用基因本體中術(shù)語(yǔ)之間的語(yǔ)義繼承對PubMed 查詢(xún)進(jìn)行語(yǔ)義擴展, 基因名稱(chēng)、符號和同義詞都作為額外的關(guān)鍵詞提交給查詢(xún)處理器。
2.2 以概念或實(shí)體為中心的檢索系統
以概念或實(shí)體為中心的檢索系統利用本體、主題詞表、敘詞表等對科技文獻進(jìn)行語(yǔ)義標注, 識別文獻中的知識, 檢索過(guò)程通過(guò)匹配用戶(hù)查詢(xún)和語(yǔ)義標注結果執行, 這使得檢索系統能夠利用標注信息查詢(xún)到更精確的結果。GoPubMed是這類(lèi)系統中最典型的, 它利用 Gene 本體和 MeSH 標引 PubMed 文獻, 并用于檢索結果的結構化展示, 可以讓用戶(hù)看到與查詢(xún)相關(guān)的主要的生物醫學(xué)概念。相比 PubMed, GoPubMed 可以更快地找到相關(guān)的檢索結果。NextBio 文獻檢索系統利用基于本體的語(yǔ)義工具和創(chuàng )新界面, 對 ScienceDirect 內容和 PubMed、臨床實(shí)驗、生物醫學(xué)新聞等授權開(kāi)放使用的研究數據進(jìn)行文本挖掘, 并通過(guò)自然語(yǔ)言處理技術(shù)實(shí)現命名實(shí)體識別和消歧, 從而提高檢索性能。Kleio 系統對文本的語(yǔ)義概念(如 genes、protein和其他生物醫學(xué)術(shù)語(yǔ))進(jìn)行標注, 提供對于 MEDLINE的文本和元數據相結合的檢索, 利用標注的命名實(shí)體類(lèi)型對檢索結果進(jìn)行分面, 從而實(shí)現檢索結果的過(guò)濾。
2.3 以關(guān)系為中心的檢索系統
以關(guān)系為中心的檢索系統通過(guò)文本挖掘技術(shù)從科技文獻中發(fā)現概念或實(shí)體之間的關(guān)系, 能夠提供基于關(guān)系的檢索服務(wù)。Quertle是一個(gè)關(guān)系驅動(dòng)的生物醫學(xué)文獻檢索工具, 使用基于語(yǔ)義的自然語(yǔ)言處理方法從生物醫學(xué)文獻集中抽取主謂賓關(guān)系, 發(fā)現生物醫學(xué)實(shí)體(如疾病、基因、藥物)之間的一般或特殊關(guān)系。
用"咖啡因偏頭痛"作為搜索詞, Quertle 會(huì )發(fā)現兩個(gè)檢索詞之間的關(guān)系如"咖啡因治療偏頭痛", 而不是通常搜索 PubMed 所返回的同時(shí)包含"咖啡因"和"偏頭痛"兩個(gè)檢索詞的記錄。CoPub是以共現關(guān)系為中心的檢索工具, 利用文本挖掘技術(shù)檢測 PubMed 摘要中共現的生物醫學(xué)概念, 如基因本體中的人類(lèi)/鼠基因、生物過(guò)程、分子功能、細胞組成以及病理、疾病、藥物和途徑等。在 CoPub 系統中檢索某個(gè)生物醫學(xué)概念, 可以獲得與其共現的其他生物醫學(xué)概念以及共同出現的文摘。PolySearch抽取人類(lèi)疾病、基因、突變、藥物和代謝物之間的關(guān)系, 利用各種文本挖掘和信息檢索技術(shù)對內容摘要、段落或句子進(jìn)行識別和排序, 支持面向十幾個(gè)不同類(lèi)型的文本、科學(xué)文摘或生物信息學(xué)數據庫的50多種查詢(xún)類(lèi)型, 例如檢索"與乳腺癌有關(guān)的基因".
2.4 面向知識發(fā)現的檢索系統
面向知識發(fā)現的檢索系統通過(guò)發(fā)現隱含的關(guān)系和知識, 從而為用戶(hù)提供更深層次的語(yǔ)義檢索服務(wù)。
CoPub 5.0在 CoPub 共現關(guān)系挖掘的基礎上開(kāi)發(fā)了稱(chēng)為CoPub Discovery的新技術(shù), 從文獻中挖掘間接關(guān)系, 用于研究疾病背后的機理、連接基因和途徑, 發(fā)現現有藥物的新型應用等。CoPub 5.0 提供了三種分析模式, "term search"模式為一個(gè)術(shù)語(yǔ)檢索文摘和術(shù)語(yǔ)關(guān)系, "pair search"模式分析術(shù)語(yǔ)對之間的已知關(guān)系或新關(guān)系, "set terms"模式用以給出多個(gè)術(shù)語(yǔ)之間的關(guān)系。
FACTA++從 MEDLINE 文摘中發(fā)現并可視化如基因、疾病、化合物等生物醫學(xué)概念之間的間接關(guān)聯(lián), 利用機器學(xué)習模型發(fā)現文本中的生物分子事件, 利用概念之間的共現關(guān)系統計出信息挖掘隱藏的關(guān)聯(lián)。EvidenceFinder實(shí)現對 PMC 全文數據從化合物基因、蛋白質(zhì)、疾病等生物醫學(xué)實(shí)體到如磷酸化、綁定、激活等生物相關(guān)性事實(shí)的多層次文本標注。Evidence-Finder 將標注事實(shí)轉化為一系列的問(wèn)題, 作為文獻檢索的推薦, 幫助用戶(hù)找到問(wèn)題答案對應的文章。例如, 輸入檢索詞"粘蛋白", 系統自動(dòng)給出一系列相關(guān)問(wèn)題, 如"降低腸道粘蛋白的是什么?"、"什么產(chǎn)生粘蛋白?"等。
3 科技文獻語(yǔ)義檢索系統的基本框架
根據對典型科技文獻語(yǔ)義檢索系統的分析, 提出系統基本框架, 分為語(yǔ)義知識獲取、數據集成與融匯、語(yǔ)義索引構建、查詢(xún)處理、結果展示 5 個(gè)主要的系統功能, 如圖 2 所示。實(shí)現科技文獻的語(yǔ)義豐富化, 基于領(lǐng)域敘詞表或本體, 利用語(yǔ)義標注、實(shí)體抽取、關(guān)系抽取等技術(shù)從科技文獻文本信息中獲取語(yǔ)義知識。以這些語(yǔ)義知識為基礎, 借助實(shí)體或概念匹配、本體集成、Linked Data 之間的關(guān)聯(lián)實(shí)現潛在語(yǔ)義知識、科技文獻以及外部資源的數據集成與融匯, 支持細粒度的語(yǔ)義檢索以及相關(guān)知識的擴展檢索。在文獻元數據索引的基礎上, 構建實(shí)體、概念、關(guān)系、文本事實(shí)依據的索引, 支撐基于語(yǔ)義的檢索功能。在查詢(xún)處理方面, 采用術(shù)語(yǔ)匹配、自然語(yǔ)言處理、相似度計算、知識庫圖遍歷、本體推理等技術(shù)手段理解用戶(hù)的搜索意圖, 通過(guò)基于語(yǔ)義知識的分類(lèi)、聚類(lèi)、排序等對檢索結果進(jìn)行重新優(yōu)化計算。通過(guò)結果列表、可視化展示、分面瀏覽、樹(shù)形導航、本體導航等方式將檢索結果展示給用戶(hù), 同時(shí)提供基于語(yǔ)義知識的相關(guān)推薦和統計預測等功能。
4 科技文獻語(yǔ)義檢索系統的功能特點(diǎn)
語(yǔ)義信息的引入影響了科技文獻檢索系統從數據處理、索引構建、查詢(xún)處理到結果管理的各個(gè)方面, 使得檢索系統具有一些新的特性。
4.1 科技文獻語(yǔ)義豐富化
在傳統文獻標引的基礎上, 一些文獻檢索系統已經(jīng)進(jìn)行了深層的語(yǔ)義豐富化處理, 并且在此基礎上提供更準確的檢索服務(wù)。例如, ProQuest在文本標引基礎上將蘊含在學(xué)術(shù)出版物中的表格、地圖、照片和其他圖形中的數據、變量以及其他內容進(jìn)行深度的標引,平均使用8個(gè)術(shù)語(yǔ)描述一個(gè)圖像。Wiley的SmartArticle技術(shù)[14]針對化學(xué)期刊新增了化合物索引, 提供對于內容的深層檢索, 此外對文獻中的化學(xué)術(shù)語(yǔ)進(jìn)行標注,使用不同顏色對不同類(lèi)型的化學(xué)術(shù)語(yǔ)進(jìn)行高亮顯示,以方便用戶(hù)閱讀。在醫學(xué)文獻檢索領(lǐng)域, PubMed使用MeSH主題詞表進(jìn)行文獻標引, 隨著(zhù)文本挖掘技術(shù)的成熟, 一些工具和系統在PubMed基礎上對科技文獻進(jìn)行了更為深入的語(yǔ)義豐富化處理[15].例如, EBIMed[16]
從文獻中抽取蛋白質(zhì)、基因本體標注、藥物和物種, 基于共現分析識別抽取概念之間的關(guān)系。PubTator工具[17]支持對PubMed檢索結果的標注, 識別的生物醫學(xué)實(shí)體包括基因、化學(xué)物質(zhì)、疾病、變異、物種等。
4.2 基于實(shí)體或概念的數據集成與融合科技文獻的數據集成已轉變?yōu)橐詫?shí)體或概念為中心的數據集成和融合, 實(shí)現不同應用系統之間的語(yǔ)義互操作, 促進(jìn)更廣泛的共享與應用。AGRIS 國際農業(yè)科學(xué)和技術(shù)信息系統利用 OKKAM 實(shí)體名稱(chēng)系統框架[18]創(chuàng )建關(guān)聯(lián)數據模型, 將書(shū)目數據庫轉換為關(guān)聯(lián)數據服務(wù).一方面, 使用 AGROVOC 敘詞表與其他敘詞表映射, 另一方面將書(shū)目記錄與外部資源建立連接,如 DBPedia、WordBank、Google Custom SearchAPI、Nature OpenSearch 等。在 AGRIS 檢索結果的詳細頁(yè)面中, 除書(shū)目信息外, 還提供相關(guān)外部資源的結果揭示, 借助文獻標引使用的 AGROVOC 詞匯、書(shū)目關(guān)聯(lián)數據等實(shí)現以實(shí)體或概念為中心的知識頁(yè)面之間的融匯。Elsevier 提出 Smart Content 的概念, 組織醫學(xué)專(zhuān)家在 UMLS 基礎上構建 EMMeT 醫學(xué)詞匯分類(lèi)體系, 將 Elsevier 的臨床醫學(xué)期刊、論文、書(shū)目章節、表格、圖像等數據映射到合適的醫學(xué)術(shù)語(yǔ)上, 從而加強對 Content 的理解, 使其提升到實(shí)體、概念和關(guān)系的知識層面上, 以便各類(lèi)應用程序更好地理解和處理內容上的內涵信息。
4.3 面向文本分析結果的索引機制。為實(shí)現對文本分析結果的檢索, 語(yǔ)義檢索系統構建了文本中概念、實(shí)體、關(guān)系、事實(shí)與文獻之間的索引。例如, Kleio系統應用Lucene對識別出來(lái)的蛋白質(zhì)、基因、代謝物和醫學(xué)術(shù)語(yǔ)構建索引, 即對與文本相關(guān)的概念構建索引, 而不是個(gè)體或規范詞形式, 這意味著(zhù)系統可以檢索與某個(gè)指定概念相關(guān)的文檔, 無(wú)論概念的表現形式是它的拼寫(xiě)變體還是縮寫(xiě)形式.
EvidenceFinder 系統借助基因、蛋白質(zhì)、藥物、疾病和代謝物的詞表以及表示生物醫學(xué)過(guò)程和關(guān)系的詞典, 對 Europe PMC 倉儲全文數據進(jìn)行語(yǔ)法分析和文本挖掘, 將所有可能包含相關(guān)事實(shí)的句子構建索引。NLMplus使用 Solr 對語(yǔ)義層進(jìn)行索引, 支撐檢索服務(wù)。而 Quertle建立語(yǔ)義關(guān)系索引、關(guān)鍵詞索引和輔助索引三種索引, 用于查找用戶(hù)輸入的檢索詞和提問(wèn),并返回檢索結果。
4.4 查詢(xún)處理
由于一個(gè)搜索請求可能代表多重含義, 對用戶(hù)輸入的檢索詞進(jìn)行語(yǔ)義分析是語(yǔ)義檢索系統的首要任務(wù)。通常, 語(yǔ)義檢索系統從用戶(hù)輸入字符開(kāi)始提供自動(dòng)完成功能, 對用戶(hù)輸入的檢索詞和語(yǔ)句進(jìn)行識別和分析, 給出相關(guān)的查詢(xún)建議, 通過(guò)理解用戶(hù)查詢(xún)意圖和搜索空間的含義改進(jìn)檢索質(zhì)量。
(1) 基于受控詞表和本體的自動(dòng)完成功能
目前, 搜索引擎大多數都具有自動(dòng)完成功能, 利用預存的術(shù)語(yǔ)自動(dòng)將用戶(hù)的檢索詞對應到可能匹配術(shù)語(yǔ)上并提示給用戶(hù), 簡(jiǎn)化用戶(hù)輸入操作。文獻檢索系統通常利用受控詞表和本體實(shí)現自動(dòng)完成功能,GoPubMed將輸入的術(shù)語(yǔ)匹配 MeSH 和 Gene 本體術(shù)語(yǔ); Semedico將查詢(xún)建議放在分類(lèi)樹(shù)中允許用戶(hù)選擇一個(gè)廣義術(shù)語(yǔ)作為檢索詞, 在括號中列出其同義詞;NextBio可以列出匹配的基因、化合物、SNPs、疾病、組織、生物學(xué)團體和作者等; Elsevier 的 ClinicalKey 醫學(xué)信息平臺在用戶(hù)輸入檢索詞后提供檢索建議, 如相關(guān)醫學(xué)主題、內容來(lái)源和作者等。
(2) 查詢(xún)分析
檢索系統在執行查詢(xún)前, 采用語(yǔ)言學(xué)方法將用戶(hù)輸入的檢索詞映射到受控詞表或本體的概念、實(shí)體上,將關(guān)鍵詞檢索轉化為概念或實(shí)體的`檢索。利用受控詞表的同義、廣義、窄義等術(shù)語(yǔ)以及基于本體上下位關(guān)系實(shí)現查詢(xún)的邏輯推理, 用于解釋用戶(hù)的查詢(xún), 并給出查詢(xún)建議。Kleio 系統將摘要中命名實(shí)體進(jìn)一步分類(lèi), 結合語(yǔ)義分類(lèi)信息執行查詢(xún), 可以降低搜索空間,提高檢索效率.一些文獻檢索系統允許用戶(hù)使用自然語(yǔ)言進(jìn)行提問(wèn), 如 Quertle、EvidenceFinder 等, 在執行查詢(xún)處理前, 需要對查詢(xún)語(yǔ)句進(jìn)行預處理, 利用自然語(yǔ)言處理技術(shù)將查詢(xún)語(yǔ)句進(jìn)行重構。NLMplus使用敘詞表和本體對 PubMed Review 進(jìn)行語(yǔ)義標引, 利用構建的知識庫對查詢(xún)進(jìn)行分析和解析, 以檢索到更精確的結果。iPubMed[23]提供一個(gè)交互式檢索界面, 當用戶(hù)在搜索框中輸入幾個(gè)字符時(shí), 系統將立即顯示任何包含這些字符的引用, 便于縮小搜索目標, 此外該系統還允許小的拼寫(xiě)錯誤。ClinicalKey 通過(guò) EMMeT建立關(guān)系的語(yǔ)義框架, 促進(jìn)內容發(fā)現, 使得被傳統關(guān)鍵詞檢索忽略的潛在關(guān)聯(lián)能夠被揭示出來(lái), 并且保證了ClinicalKey能夠為用戶(hù)的檢索請求提供具體并且有針對性的答案, 比如查找"myocardial infarction",ClinicalKey 智能檢索可以識別其縮略詞、同義詞、相關(guān)外科手術(shù)和治療藥物, 并且知道這是一種與高膽固醇相關(guān)的心血管疾病[20].
4.5 查詢(xún)結果管理在傳統文獻檢索系統的基礎上, 語(yǔ)義檢索系統對于查詢(xún)結果的呈現方式更加多樣, 表達的信息也更加豐富, 基于本體的結果精煉、知識導航等為用戶(hù)帶來(lái)了新的檢索體驗。
(1) 查詢(xún)結果呈現方式語(yǔ)義檢索系統為用戶(hù)提供了最直接的結果呈現方式, 如檢索的目標概念(實(shí)體)、關(guān)系、事實(shí)、回答等信息。GoPubMed[5]在文獻結果列表中只顯示文摘中與檢索目標相關(guān)的句子, 反映檢索詞的事實(shí), 而不是全部摘要信息。Quertle[8]同樣顯示文摘中相關(guān)的事實(shí)信息,并對檢索目標進(jìn)行高亮顯示。FACTA++[12]將與查詢(xún)目標相關(guān)的概念通過(guò)不同分類(lèi)列表的方式顯示, 并可以按照相關(guān)的頻次排序。CoPub[9]返回查詢(xún)術(shù)語(yǔ)的詳細信息、共現術(shù)語(yǔ)的分類(lèi)和文摘數量。EvidenceFinder[13]在文獻檢索列表中直接給出查詢(xún)問(wèn)題的答案并高亮顯示。
(2) 概念/實(shí)體層級結構分類(lèi)與導航GoPubMed[5]通過(guò)本體的層級結構對查詢(xún)結果進(jìn)行聚集, 實(shí)現了大規模結果的快速導航, 用戶(hù)可以快速獲取相關(guān)的生物醫學(xué)概念, 同時(shí)可以在檢索中發(fā)現新的檢索目標或過(guò)濾檢索條件, 使得檢索更有深度和廣度。NextBio[6]將從摘要和正文中抽取的生物醫學(xué)術(shù)語(yǔ), 以Tag云的方式顯示, 并提供這些術(shù)語(yǔ)的分類(lèi), 可以利用它們進(jìn)一步過(guò)濾和優(yōu)化查詢(xún)結果。Kleio[7]將檢索結果根據文獻標注命名實(shí)體的語(yǔ)義分類(lèi)進(jìn)行組織,并列出最高關(guān)聯(lián)頻率的概念, 方便用戶(hù)瀏覽和過(guò)濾檢索結果。ClinicalKey 允許用戶(hù)根據有臨床意義的子分類(lèi)篩選檢索結果, 比如內容類(lèi)型、專(zhuān)科、疾病名稱(chēng)、身體部位等[20].
(3) 文本挖掘結果顯示與相關(guān)知識導航在結果頁(yè)面或文獻詳細頁(yè)面對語(yǔ)義標注結果進(jìn)行呈現, 并提供相關(guān)知識的簡(jiǎn)介、鏈接與導航, 例如GoPubMed[5]在標注概念下方用虛線(xiàn)標記, 點(diǎn)擊后可實(shí)現對標注概念的重新檢索和二次檢索, 以及直接給出標注概念的詳細信息、W kipedia 鏈接。EvidenceFinder系統[13]在文獻詳細頁(yè)面將識別的生物實(shí)體統計情況以圖形化的方式顯示, 并根據不同的類(lèi)型分別列出, 點(diǎn)擊標注實(shí)體可以直接鏈接到 UniProtKB的相關(guān)檢索界面,查看相關(guān)信息。ClinicalKey平臺在檢索結果頁(yè)面提供文獻摘要的預覽窗口, 同時(shí)對語(yǔ)義標注的結果進(jìn)行展示,并且提供 2 000 多個(gè)疾病主題頁(yè), 可以快速訪(fǎng)問(wèn)疾病的流行病學(xué)、風(fēng)險因素、臨床表現、治療等方面的信息, 以及與特定專(zhuān)科相關(guān)的答案和藥物鏈接[20].
(4) 基于概念/實(shí)體的文獻統計分析。通過(guò)對文獻的文本挖掘, 語(yǔ)義檢索系統可以實(shí)現基于概念/實(shí)體而不是關(guān)鍵詞等元數據信息的文獻統計分析功能。例如, 在 GoPubMed[5]平臺上點(diǎn)擊左側導航的概念或文本標注概念都可以看到該概念相關(guān)文獻的時(shí)間軸, 不僅可以展示相關(guān)文獻的演化過(guò)程, 也可以預測其發(fā)展趨勢。
5 結 語(yǔ)
科技文獻語(yǔ)義檢索系統相比傳統檢索系統, 其優(yōu)勢在于能夠處理語(yǔ)義信息, 從非結構化文本中發(fā)現潛在知識, 實(shí)現知識檢索, 滿(mǎn)足用戶(hù)更高的檢索需求。通過(guò)研究和分析現有科技文獻語(yǔ)義檢索系統可以發(fā)現系統的語(yǔ)義化程度依賴(lài)于對文獻的語(yǔ)義挖掘深度, 借助現有的文本挖掘、自然語(yǔ)言處理、語(yǔ)義網(wǎng)等技術(shù)以及受控詞表和本體, 在很大程度上實(shí)現了對指定信息的挖掘和發(fā)現, 然而由于受控詞表和本體的領(lǐng)域局限性和覆蓋率問(wèn)題, 科技文獻語(yǔ)義檢索系統的研究主要集中在生物醫學(xué)領(lǐng)域, 而在科技文獻檢索領(lǐng)域實(shí)現通用的語(yǔ)義檢索仍然困難重重。
【科技文獻語(yǔ)義檢索系統的分類(lèi)與功能特點(diǎn)論文】相關(guān)文章:
MPA論文的特點(diǎn)分類(lèi)以及選題06-29
多功能農業(yè)科技論文03-30
科技畢業(yè)論文參考文獻01-28
批復的特點(diǎn)及分類(lèi)10-16
科技論文作者署名、文獻人名的書(shū)寫(xiě)形式規范05-27
基于語(yǔ)義識別分析論文04-27
彩色剪紙的特點(diǎn)分類(lèi)03-27