數據轉換問題,特別是針對勘測部門,決不是一個簡單的數據處理工作,而是一個關系到從內部管理到外部競爭的企業發展的戰略問題。
EPSX 跨GIS平臺數據轉換系統為多源數據集成和數據共享而專門研發的空間數據交換系統,系統以 EPS 的 EDB 為中心,通過信息映射機制和模板定制 ,模擬對方系統的數據表現形式, 建立信息的相互對應關系,完成不同系統間的圖形與屬性數據的雙向交換,實現跨平臺的數據共享與大比例尺的變比例制圖綜合。系統有效地解決 GIS 數據來源和數據更新問題, 提高現有數據的使用價值。
已實現的轉換:
圖 1:已實現的轉換
數據轉換的意義
外部市場的客觀要求
隨著外部市場的對地理信息的要求模式驟然增多,以至于我們無法把握隨時到來的要求究竟有多少種類。如果不能夠徹底掌握數據轉換技術,就意味著不能掌握市場,甚至面臨機會也無法把握,最終逐步被市場所拋棄;而掌握了數據轉換,就可以隨時面對各種地理信息要求的挑戰,從容處理各種數據要求,以最快、最可靠的技術路線,完成市場任務。
對內統一生產模式,統一平臺
對紛繁復雜的、無法把握的市場要求,我們為保證市場,有兩種處理問題的方式,一是“兵來將擋,水來土掩”的被動方式,即一但任務到來,迅速分析情況,確定方案,抽調力量,組織攻關,這不僅需要大量的人才,還要緊急培訓,組織消化任務要求,方能保證按質量完成;另一種是生產方式相對不變,強化數據轉換能力,雖然仍然需要分析任務要求,但生產可按原方式不停,生產人員、生產效率有保證,成本不提高。調整轉換的“模板”--- 這個開放的轉換設置規則,就可以滿足市場要求。數據轉換,就是統一生產模式的技術保障。
建立有競爭力的數據基礎
數據轉換的深刻理解與掌握,有助于了解數據的價值取向,這樣就可在數據不動的前提下,通過轉換機制的建立,形成一套可適應發展的數據架構,使數據的分發能力具有足夠的競爭力,即可在短時間內使數據滿足各種不同要求。
數據出入,依托數據轉換,從而統一平臺自如生產建庫,從無序到有序
由于歷史的原因,經歷了數字化到規范化的艱苦歷程,同時積累了大量的各種時期、各種要求的甚至沒有要求的各種數字信息。對一個單位,自身沒有形成一套規范的數據,五花八門,扔也不可,用也不可,這種狀況完全不適合發展的需要,而且一旦使用成本極大。統一規范,就是統一指導思想、就是統一平臺。統一平臺后,就開始建立良性循環,逐步積累優秀的數據,不再繼續產生“數據垃圾”。各個混亂的數據要充分利用起來,就靠數據轉換進行一次性處理。
統一的生產平臺能夠導入各種基礎地理數據,然后經過“規范”,混亂的數據步入標準化,然后建庫更新;生產由此從無序進入有序,基礎地理數據的現勢性和標準化得以保證,基于此再集成各個市場出現的平臺的優勢組織高端生產,勘測單位的數據服務能力必然大大增強。
軟件系統,各個都有其強,各個都有其弱。除基礎數據及基礎地理信息系統相對固定外,社會應用強調專業數據,專用系統。專用系統在專業處理數據的優勢是顯著的。任何除了傳統意義提供圖紙外的數據生產都是為高端服務,我們稱其為高端生產。有效利用專業系統的能力,可極大提高效率。想利用專業系統,就要把數據轉入,沒有數據轉換是不可實現的。
問題:數據轉換為什么這么難
兩個系統交換數據,所有困難的產生,都是因為沒有規范,或不執行規范,或規范不清晰導致理解不同,或執行規范不同造成。我們無法改變這個事實,所能做的是有一個自己的、可操作的規范,如《城市基礎地理信息系統技術規范》(《規范》),而其他的,全部靠數據轉換。
要素定義不同
同名不同義,如“過街天橋”,《規范》定義為其輪廓線,有些系統定義為面;同義不同名,《規范》有定義為“石質的陡岸”,有些系統稱為“泊岸”。
要素理解不同
如“有看臺的露天體育場”,《規范》定義為內外輪廓線組合,有些系統理解為外輪廓。
要素定位不同
點狀要素如門墩,一般定位點位于符號中央,有些系統位于左下角。線狀要素如鐵路,定位線在右側、中間、左側不同系統有不同要求;注記也有同樣問題。
要素內點的組織要求不同
如低壓電力線,《規范》要求將電桿點按線連接組織,有的系統則每兩個相鄰的桿組成線段,有的索性逐個桿依據相鄰桿的方向按有向點組織?;蛘哂械慕M織順時針,逆時針區別,或起始點不同,或方向不同。
分層代碼不同
分層不同,意味著整層處理或管理不相同;代碼不同是必然的,因為社會應用者一般會按自己的要求進行編碼。
要素取舍不同
《規范》有的,有的系統不要;或有的系統有《規范》以外的要求。
要素表現形式不同
如地下室入口, 可以表現為面, 也可以表現為線,或表現為輪廓加輔助線的組合等。
要素的信息表現與圖式表現矛盾
如傳送帶等,信息要求為骨架線(四個點)時,有些系統不能產生要求的圖式,因此就產生用新的定義解決這個問題的方法,如邊線、輔助線、輔助點等。
屬性內容與類型不同
如房屋結構,《規范》用字符方式,內容可直接為“磚”,其他系統有的用數字如1代表“磚”等。
必須窮舉一切需要交換的要素,“一個也不能少”。工作量大、要求高
地理信息的特點,是全面、完整的地理數據組織。其中任何數據的質量不好,都會導致數據應用者對所有數據質量的懷疑。所以,必須全面研究轉換對象的所有要素,并保證所有轉換無誤。
技術原理
所有數據“穩定”到一個標準上
在相當長的時間內,數據轉換問題都是測繪界的關鍵問題之一,也是測繪信息化技術中,工作量最大的問題。因此,清華山維將這個技術按“標準”的規格加以規定,目的是確保每個數據轉換項目得到全面、徹底、完美地實現。
由于市場需求變化萬千,但任何市場要求都從現有的數據發展,所以固定一個標準很重要,至少一次研究后,任何轉換只需要研究對方就可以了,節省一半的工作。EPS平臺已經嚴格按《規范》確定了標準,一般可以直接使用。一切轉換基于《規范》,保證“基本立場”。
因為轉換的復雜,并非在純格式問題上,所以,任何轉換先使數據“分解”,完成了數據的自動加工過程,使EPS平臺下的數據與被轉換對象“一一對應”。然后就是純格式轉換問題了。
一般轉換都經過兩個過程,先“分解”到與互轉對象“一一對應”,然后純格式轉換,兩步都是自動進行。
擴展仿真被轉換的數據結構(信息映射)
除非《規范》的要素與被轉換要素一一對應,否則必須擴展《規范》,使包容被轉換要素,從而實現“一一對應”;這樣,就具備了轉換的基礎,同時,也可以在EPS平臺中模擬任何被轉換系統的要素。
填寫信息映射
這是EPS平臺轉換的核心技術(信息映射機制)。它既可以把其他系統一一對應的要素保持不動,直接轉換到EPS平臺;同時也可以把自身要素按照一定規則分解映射為仿真的被轉換數據,直接輸出轉換到其他各種系統。
所有前面提到的系統之間的要素差異問題都在“映射”中解決。
理解EPS平臺轉換技術
熟悉轉換全過程,排除技術恐懼心理。先把被轉換的環境安裝好(各個系統都安裝),用現成的例子轉轉看。注意通過選擇查詢觀察各個要素在原系統的信息組織,EPS平臺中的數據組織,或者EPS平臺中的數據組織以及被轉換后的其他系統中的數據組織。你可能會發現幾天時間你可以把幾乎所有的數據轉換都了解了。
通過等價類熟悉映射語法
等價類:站在特定研究的角度看,某個對象如果與其他對象相同,則這個對象可以作為代表,就是其他對象的等價類。
等價類是全部要素的典型代表,等價類轉換通暢能夠說明轉換技術路線沒問題。逐個觀察等價類的映射語法,學習嘗試擴展自己的等價類需要。注意點、線、面、注記、屬性及其內部不同類型的數據特點。
其中最重要的觀點是,符號 = 信息的嵌套,轉換 = 嵌套的分解過濾。除了最終的基本點、基本線、基本面外,中間全部是信息(主要表現為含代碼的幾何特性)。
用信息的觀點看符號
符號中的每個點、線都有可能成為其他系統需要分解的內容。確信這種可能,就要做好準備,加一層信息就好。如鐵路,信息的觀點看,可能包括左線、右線及中線(看不見的線),如果被轉換方需要中線定位,預留中線就會發揮作用。
模仿與查找需要的要素
一般總可從已經提供的模板中找到類似的要素。如天文點可模仿三角點,高壓電力線可模仿低壓電力線等。模仿可以使我們較快地學會調整模板為自己的轉換服務。
可以通過“按轉換定制打散”在EPS平臺中檢查數據是否達到了轉換目的(菜單:【處理】- 【圖形打散與對象拆分】 ,選擇“按轉換定制打散”)。
熟悉EPS平臺的模板控制技術和腳本技術
熟悉掌握EPS平臺的模板控制技術有助于理解和實現轉換中所要面對的要素之間的信息映射;
熟悉和掌握腳本技術,可以利用EPS平臺提供的腳本編程技術,精確控制轉換參數,實現數據在不同系統之間的更加自如的準確共享,從而從作業層面上實現“一鍵轉換”或“自動轉換”。
北京山維科技股份有限公司 Beijing Sunway Technology Co., Ltd.
北京市昌平區北清路中關村生命科學園生命園路4號院博雅CC 7號樓4層 總 機:010-52593970 /71/72/73/74/75 傳真:010-52593979
版權所有© 2015 京ICP備14014528號-1 京公網安備 11011402010810號