海量數據催生的地理知識服務
基礎地理信息數據具有空間載體和知識存儲兩大作用。
以往的地理信息數據往往以地理信息服務的形式為人們提供基礎信息,人們通過網絡可以隨時隨地獲取地理信息目標。隨著社會的發展與進步,在“四個全面”戰略布局及生態文明建設方針的指導要求下,用戶不僅需要地理目標的空間信息,還要知道其空間格局、地域差異、時空規律、歸因機制等相關地理知識。數據海量、信息復雜、知識難求……用戶的需求無法得到滿足,基礎地理信息數據的信息作用受到了嚴重的限制。
所謂地理知識服務即以地理知識為服務內容,以計算機中的形式化知識表示為地理知識載體,以地理空間認知智能為智能特征,以面向情境或問題或主動或應需準確提供地理知識為服務目標。(慎利《從地理信息服務到地理知識服務:基本問題與發展路徑》)
時空知識圖譜助力情景化智能推理
地理知識服務與地理信息服務之間聯系密切,但又有本質區別,準確來說地理知識包含地理信息服務,地理信息服務只占地理知識的極小一部分內容。
下面我們以一個場景做一個簡單介紹:設想春運期間出現新冠肺炎疫情,需要駕車回老家的地理信息服務場景。
現有的導航服務軟件可以準確地提供實時導航,但是它不能在導航開始前就給出途經地的疫情防控政策,如某一高速口沒有24小時內的核酸檢測陰性證明就無法通行,那么以“在出行前需要做核酸檢測”這一重要提示信息為例,圖1給出了地理知識推理的整體流程。
![技術探討‖從地理信息服務到地理知識服務的轉變 技術探討‖從地理信息服務到地理知識服務的轉變]()
圖1?疫情期間通行情景化下的地理知識推理的整體流程
在現實中類似的基于知識的情景化推理智能服務非常普遍,如野生環境保護區有野獸出沒提醒、野外移動網絡信號覆蓋提醒、隧道行車易發生交通事故地段提醒等等,從本質上來說這些場景所需要的服務就是地理知識服務。
河南數慧信息技術有限公司為助力地理知識服務,自主研發了基于neo4j圖數據庫的知識圖譜構建平臺,為用戶提供從知識獲取到圖譜生成,再到圖譜應用一整套流程。不管是與關系型數據庫相比,還是與其他NoSQL數據庫相比,Neo4j都表現出很多前所未有的優勢,主要體現在查詢的高性能、設計的靈活性和開發的敏捷性等。
時空知識圖譜構建平臺包括5大模塊。
(1)?數據管理——數據庫接入及知識抽取。
(2)?概念模型指明實體和關系存儲模式——比如關于人的信息很多,而可獲取的信息有限,有價值的信息也有限,通過概念模型可以指定具體哪些信息需要存儲到圖庫中,以及如何存儲這些信息。
(3)?知識圖譜入庫——支持csv文件形式和數據庫的接入入庫,將模塊(1)獲取的知識,通過模塊(2)建立的模型存儲到知識圖譜中。
(4)?圖譜搜索——支持知識圖譜的精確和模糊查詢,以及關系和實體的搜索。
(5)?提供圖的常見算法——目前先提供最短路徑、路徑查找、pagerank、LPA四個算法,后續持續添加。
![技術探討‖從地理信息服務到地理知識服務的轉變 技術探討‖從地理信息服務到地理知識服務的轉變]()
圖2?時空知識圖譜數據層構建流程
![技術探討‖從地理信息服務到地理知識服務的轉變 技術探討‖從地理信息服務到地理知識服務的轉變]()
圖3 時空知識圖譜構建平臺功能模塊