時(shí)間:2022-12-15
2022年2月,自然資源部下發(fā)《關(guān)于全面推進(jìn)實(shí)景三維中國(guó)建設(shè)的通知》。通知中明確實(shí)景三維中國(guó)建設(shè),是面向新時(shí)期測(cè)繪地理信息事業(yè)服務(wù)經(jīng)濟(jì)社會(huì)發(fā)展和生態(tài)文明建設(shè)新定位、新需求,對(duì)傳統(tǒng)基礎(chǔ)測(cè)繪業(yè)務(wù)的轉(zhuǎn)型升級(jí),是測(cè)繪地理信息服務(wù)的發(fā)展方向和基本模式。
實(shí)景三維中國(guó)作為新型基礎(chǔ)測(cè)繪標(biāo)準(zhǔn)化產(chǎn)品,以項(xiàng)目的形式對(duì)前期新型基礎(chǔ)測(cè)繪的技術(shù)能力建設(shè)提出了更高的實(shí)際需求。
基礎(chǔ)地理實(shí)體數(shù)據(jù)是整個(gè)新型基礎(chǔ)測(cè)繪產(chǎn)品體系中的核心成果,具有全新的概念解釋、全球唯一的實(shí)體編碼。并且承載二三維一體化管理、多尺度表達(dá)、語(yǔ)義化識(shí)別、按需組裝的技術(shù)要求。目前,行業(yè)內(nèi)對(duì)于地理實(shí)體的概念和語(yǔ)義化基本有統(tǒng)一的認(rèn)識(shí),從實(shí)現(xiàn)層面,也還沒(méi)有形成主流的技術(shù)解決方案。
安圖新型基礎(chǔ)測(cè)繪采編軟件在地理實(shí)體數(shù)據(jù)轉(zhuǎn)換、整合、編輯、質(zhì)檢等功能基礎(chǔ)上,采用成熟的大數(shù)據(jù)、分布式數(shù)據(jù)庫(kù)等技術(shù)定義語(yǔ)義模型,開發(fā)語(yǔ)義化提取、地理實(shí)體語(yǔ)義入庫(kù)等功能,完善基礎(chǔ)地理實(shí)體采編業(yè)務(wù)整體解決方案。
針對(duì)實(shí)體數(shù)據(jù)二三維數(shù)據(jù)生產(chǎn)特點(diǎn),我公司研發(fā)了新型基礎(chǔ)測(cè)繪采編軟件,提供數(shù)據(jù)預(yù)處理、二三維數(shù)據(jù)采集與編輯、實(shí)體數(shù)據(jù)生產(chǎn)與語(yǔ)義構(gòu)建、數(shù)據(jù)質(zhì)檢、成果管理等全套數(shù)據(jù)處理工具。

圖1 系統(tǒng)功能模塊
軟件平臺(tái)提供基礎(chǔ)數(shù)據(jù)的交互式編輯、GP批量數(shù)據(jù)處理、流程化的編輯模型。并且根據(jù)實(shí)體數(shù)據(jù)生產(chǎn)特點(diǎn),提供居民地實(shí)體的房屋院落合并、房屋屬性繼承、小區(qū)結(jié)構(gòu)簡(jiǎn)化。道路交叉口結(jié)構(gòu)生成、提取中心線、實(shí)體連接。水系連接、專項(xiàng)調(diào)查屬性掛接等等工具。

提供專門服務(wù)于地理實(shí)體數(shù)據(jù)的實(shí)體圖元組合、實(shí)體編碼、實(shí)體對(duì)象查看、實(shí)體對(duì)象編輯等功能,便于實(shí)體對(duì)象的組合管理。

系統(tǒng)提供可定制的數(shù)據(jù)質(zhì)檢能力,可根據(jù)質(zhì)檢規(guī)則定制質(zhì)檢項(xiàng),定制檢查參數(shù)。根據(jù)選擇的質(zhì)檢項(xiàng)進(jìn)行數(shù)據(jù)質(zhì)檢,結(jié)果采用JSON方式存儲(chǔ)。
質(zhì)檢完成的結(jié)果以列表的方式進(jìn)行展示,配合編輯窗口進(jìn)行要素定位,交互修改。質(zhì)檢結(jié)果可另存輸出為矢量和表格文件。

對(duì)于實(shí)體數(shù)據(jù)成果,提供成果數(shù)據(jù)瀏覽、輸出、數(shù)據(jù)備份及恢復(fù)、報(bào)表匯總、報(bào)表輸出、元數(shù)據(jù)管理、數(shù)據(jù)字典管理、系統(tǒng)管理等功能。

語(yǔ)義化是基礎(chǔ)地理實(shí)體數(shù)據(jù)的重要特征之一,對(duì)于實(shí)現(xiàn)?“人機(jī)兼容理解”、推動(dòng)數(shù)據(jù)服務(wù)向知識(shí)服務(wù)發(fā)展具有重要意義。
語(yǔ)義化內(nèi)容包括實(shí)體屬性及實(shí)體關(guān)系兩部分,實(shí)體屬性包括對(duì)實(shí)體類別、實(shí)體名稱、空間身份編碼以及實(shí)體擴(kuò)展屬性的提取、完善、表達(dá)。
實(shí)體關(guān)系包括空間關(guān)系、類屬關(guān)系、時(shí)間關(guān)聯(lián)關(guān)系以及幾何構(gòu)成關(guān)系等等,新型基礎(chǔ)測(cè)繪采編軟件語(yǔ)義化構(gòu)建模塊提供實(shí)體數(shù)據(jù)的語(yǔ)義模型定義、語(yǔ)義化提取以及地理實(shí)體語(yǔ)義入庫(kù)等功能。
語(yǔ)義化后臺(tái)存儲(chǔ)采用分布式搜索和分析引擎 Elasticsearch,主要因?yàn)槠渲С諮ava 開發(fā),和 Supermap IDesktopX 能夠結(jié)合使用,支持大數(shù)據(jù)分布式存儲(chǔ)。支持 Mapping 映射,支持 JSON 結(jié)構(gòu)化查詢,能夠海量數(shù)據(jù)秒級(jí)檢索。
屬性語(yǔ)義化是根據(jù)選取的地理實(shí)體屬性信息按照語(yǔ)義化方法進(jìn)行提取、存儲(chǔ)、應(yīng)用的過(guò)程。地理實(shí)體數(shù)據(jù)的屬性還是以傳統(tǒng)二維表的方式存儲(chǔ)為主,屬性語(yǔ)義化支持用戶為各類地理實(shí)體定制提取的屬性字段,下圖選取POI數(shù)據(jù)的名稱信息和路口的連接信息作為語(yǔ)義化字段進(jìn)行提?。?/span>

在《新型基礎(chǔ)測(cè)繪與實(shí)景三維中國(guó)建設(shè)技術(shù)文件-7基礎(chǔ)地理實(shí)體語(yǔ)義化基本規(guī)定》中已經(jīng)對(duì)地理實(shí)體的關(guān)系語(yǔ)義化內(nèi)容做了規(guī)定:

軟件根據(jù)標(biāo)準(zhǔn)定義,關(guān)系語(yǔ)義化選取內(nèi)容如下:? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ???

根據(jù)以上屬性語(yǔ)義化和關(guān)系語(yǔ)義化的內(nèi)容,結(jié)合 Elasticsearch的索引存儲(chǔ)方式,設(shè)計(jì)地理實(shí)體對(duì)應(yīng)的 Mapping,形成最終的索引定義如下:


依據(jù)配置的屬性語(yǔ)義和關(guān)系語(yǔ)義提取規(guī)則,首先分析每一類實(shí)體的屬性信息,進(jìn)行屬性內(nèi)容處理,拼接成可進(jìn)行全文或者關(guān)鍵字匹配的查詢內(nèi)容。
關(guān)系語(yǔ)義化采用傳統(tǒng)的拓?fù)浞治龇椒?,?duì)預(yù)處理好的,符合拓?fù)湟蟮幕A(chǔ)數(shù)據(jù)進(jìn)行包含/被包含/鄰接/聯(lián)通等各種關(guān)系分析,在分析基礎(chǔ)上,提取各類地理實(shí)體的關(guān)系語(yǔ)義化內(nèi)容。
最后將屬性語(yǔ)義內(nèi)容和關(guān)系語(yǔ)義內(nèi)容共同組成一個(gè)完整的語(yǔ)義化實(shí)體,為了便于分析,先將實(shí)體語(yǔ)義化文本保存在指定的字段內(nèi)容。
安圖新型基礎(chǔ)測(cè)繪采編軟件語(yǔ)義化提取界面及關(guān)系語(yǔ)義內(nèi)容如下:


在地理實(shí)體語(yǔ)義化提取完成后,已經(jīng)能夠形成完整的地理實(shí)體語(yǔ)義定義。地理實(shí)體語(yǔ)義入庫(kù)將提取的內(nèi)容更新到分布式搜索和分析引擎 Elasticsearch中。
功能采用Elasticsearch的底層操作類庫(kù)REST Client 來(lái)直連操作,程序界面及搜索結(jié)果界面如下:


基礎(chǔ)地理實(shí)體數(shù)據(jù)是整個(gè)新型基礎(chǔ)測(cè)繪和實(shí)景三維中國(guó)的核心成果,承擔(dān)了地理信息 “全空間”自然資源管理、“立體真實(shí)“實(shí)體表達(dá)、跨尺度實(shí)體組合、人機(jī)兼容理解、動(dòng)態(tài)物聯(lián)感知數(shù)據(jù)融合等應(yīng)用場(chǎng)景的數(shù)據(jù)模型基礎(chǔ)。
語(yǔ)義化后的地理實(shí)體能夠應(yīng)用更通用的大數(shù)據(jù)、分布式存儲(chǔ)、AI識(shí)別等等技術(shù)。將傳統(tǒng)GIS拓?fù)浞治銮耙疲谡Z(yǔ)義化檢索基礎(chǔ)上,無(wú)論是人機(jī)兼容理解還是真實(shí)自然資源表達(dá)上達(dá)到了更高的水準(zhǔn)。
北京世紀(jì)安圖結(jié)合實(shí)景三維中國(guó)技術(shù)大綱要求,采用成熟的大數(shù)據(jù)、分布式數(shù)據(jù)庫(kù)等技術(shù)對(duì)地理實(shí)體分類編碼、語(yǔ)義化表達(dá)以及應(yīng)用場(chǎng)景開發(fā)了安圖新型測(cè)繪采編軟件,形成了可實(shí)現(xiàn)、可應(yīng)用的地理實(shí)體數(shù)據(jù)提取、存儲(chǔ)、表達(dá)、應(yīng)用的解決方案。 供稿:研發(fā)中心 趙北戰(zhàn) 編輯:譚琳 審核:陳東 審簽:祝欣欣