從知識發掘與資料探勘看自願性地理資訊之價值

自願性地理資訊是集結群眾的地理資料,常常記錄一般人對於週遭環境的經驗、感受與喜好,而知識發掘與資料探勘則是綜合各種技術和方法以便從資料中擷取出有用的知識,如何善用知識發掘與資料探勘由自願性地理資訊挖掘出有用的知識成為新世代地理資料科學家課題,讓我們用幾個實際的案例來說明知識發掘與資料探勘帶來解決問題的潛力,以及自願性地理資訊帶來的新的研究視野。

知識發掘與資料探勘

由於網路科技的發展,資料在網路中持續地快速增長,如何有效去蕪存菁,找出資料有用的知識,以解決問題,成為一項挑戰,知識發掘與資料探勘(Knowledge Discovery and Data Mining, KDD)即是一個跨領域的科學,著重於利用各種方法由資料中擷取出有用的知識,這些方法包含統計學、資料庫、圖形辨識、機器學習、資料視覺化、最適化分析、和高效能運算等研究。傳統的地理資料處理方法不足應付當今巨量且多樣化地理資料,知識發掘與資料探勘在地理資訊科學逐漸被重視,近年來常被應用於了解複雜的地理現象,例如,人與環境交互影響和社會經濟動態,同時也著重在於真實世界的危急問題,例如全球氣候變遷和流行性疾病散播(Mennis and Guo, 2009)。

自願性地理資訊

資通訊科技的革新,Web 2.0世代的來臨,改變了網路使用者的角色,從傳統上的資訊消費者,轉變成提供網頁內容的資訊生產者,同時,這個轉變也帶動了地理資訊的改變。傳統上地理資訊的生產是需要透過專業訓練的人員來製作,這些地理資料生產的工作也多數集中在測繪製圖單位、學研機構,然而,上述網路環境的轉變,也帶動地理資料生產方式的改變,新興的資通訊技術,開創了網路上開放性協同合作架構,帶動了網路地圖技術的革新,加上全球定位系統(Global Position System, 簡稱GPS)裝置的普及,使得一般人很容易地就可以在網路上共同地生產出地理資料,例如,開放街圖(OpenStreetMap, OSM),即是一個協同合作的線上地圖,參與者並非都是地理資訊專家,透過網路共同地繪製且編修地圖,這個地圖的產生不是專家學者的規劃,再由訓練有素的人員來繪製,相對地,這是透過一般人以協同合作的方式來產生,他們自願地貢獻時間精力來參與地圖繪製,產生地理資料,這類的地理資料通常被稱為「自願性地理資訊」 (Volunteered Geographic Information, VGI)(Goodchild, 2007)。

群眾外包集體智慧

自願性地理資訊其實就是一種群眾外包(Crowdsourcing)[1]的地理資料,在群眾集體協同合作的完成工作,在同儕相互檢視與競爭下,在生產的資料中產生集體智慧。 由群眾參與的製圖而成的開放街圖,縱然在一些區域的完整度和正確性仍有不足,但讓人驚艷的地方是,有許多地區已經達到商用水準,如西歐、美國、和日本,且與專業的地理資訊的品質亦相去不遠(Haklay, 2010),而包含於開放街圖中的知識,常成為補充專業性地理資訊不足的資源,以香港大學為主的研究團隊,他們利用開放街圖資料擷取土地坵塊的特性與類別,以便進行都市規劃(Liu and Long, 2015),而芬蘭國家土地測量局的一項研究也利用開放街圖擷取自行車道的資料,進而分析自行車道受歡迎的程度(Bergman and Oksanen, 2016)。

社群媒體的地理資料

除了開放街圖,事實上,有更多的自願性地理資訊是來自於社群媒體的使用,使用者為了分享訊息於社交網絡中,常常附帶一組地理座標於照片或文字中,使得這些分享的內容成為地理資料,這樣的地理資料,在多數情況下,不是事前的規劃才去產生的資料,而是一般民眾在日常生活中對週遭環境的觀察與感想,藉由社群媒體中分享於親朋好友,進而逐漸累積成有意義的資料,舉例而言,Flickr是知名的照片分享平台,提供使用者以標籤(tag)分類照片,當一地名被當成標籤而使用於帶有地理座標的照片時,這些照片所形成空間範圍,則可以表示一般人對於該地名所認知的空間範圍,圖1中所顯示的是以「公館」為標籤且帶有地理座標的照片所群聚出之區域,從圖上可以明顯看出,台北市內的公館是以新生南路到基隆路間的羅斯福路為基礎,並往北方的新生南路、東北方台灣大學校園、西南方的寶藏巖擴展,也就是說,當一般人提到台灣大學附近的公館時,其心裡所認知的空間範圍有可能不只有水源市場附近,而是更大的範圍。

圖1: 有「公館」為標籤且帶有地理座標的照片所群聚出之熱區圖

文字訊息是社群媒體中主要的內容,目前己經有許多研究和應用利用文字探礦(Text mining)的方法,由社群媒體的文字訊息來獲取有用的資訊或知識,例如預測群眾運動的發生、輿論的發展趨勢、商品的網路口碑、和災情分析等,同樣的,文字探礦應用於社群媒體也為地理資訊研究帶來不同視野,仇恨的地理(The Geography of Hate)是洪堡德州立大學(Humboldt State University)史蒂芬斯博士(Monica Stephens)團隊所執行的計畫,這個計畫的動機和剛卸任美國總統歐巴馬(B. Obama)有極大關係,他在第二任當選時,不滿他當選的人在推特(Twitter)中大量用歧視性字眼攻擊他,如黑鬼(nigger)和猴子(monkey),歧視性字眼的使用代表著仇恨、忿怒的負面情緒,而這些推特文(tweets)帶有地理座標,可標示於地圖,因此可以呈現出這些「仇恨」的地理空間分佈。該研究團隊收集2012年6月到2013年4月間,超過15萬筆的推特文,利用情感分析(sentiment analysis)將推特文分類,並依照情緒字眼所設計的量表,來區分出正面、中立、和負面,研究團隊不僅處理了對於種族仇視情緒,也處理了同性戀和身障者的仇視程度,當負面的仇恨情緒愈高時,在地圖上顯示的就愈紅、反之則愈藍,圖2所顯示的是黑鬼(nigger)的仇恨情緒的空間分佈,呈現出美國東西二岸相當不同的結果。

圖2: 黑鬼(nigger)的仇恨情緒的空間分佈 (http://users.humboldt.edu/mstephens/hate/hate_map.html)

GPS航跡中的時空間樣態

事實上,GPS航跡是自願性地理資料中不可或缺的一塊,許多人常會把跑步、自行車、開車、登山健行等活動所記錄的航跡分享,透過時空間這些航跡常常可以擷取出一些有意義的事件或地點。德國弗勞恩霍夫爾智慧分析與資訊系統研究所(Fraunhofer Institute IAIS)為主的研究,他們在義大利米蘭中收集了17,241部車子於一週中的GPS航跡,如圖3所示,利用時空間群聚分析把時空間行為相似的航跡歸類,並且區分出塞車事件和興趣點,圖4即是研究團隊從龐雜的GPS航跡中歸類出有意義的事件(Andrienko et al., 2011)。此外,北京大學為首的研究團隊分析北京市的塞車樣態,他們收集北京市中28,519部計程車在24天的GPS航跡,不但以時空間群聚分析把塞車事件區分出來,而且進一步地區分同一路段不同方向塞車樣態,圖5中說明了(a)路段是北三環路,很規律地在週間7:30-10:00和13:30-18:30二個時段都容易塞車,(b)路段的車速偏低,因為是在二個小學間,但週間的7:30-8:00時段是接送學生的時間,最容易塞車,(c)和(d)都是在北京西站旁的隧道,但分屬二個方向,一方向容易在早上塞車,而另一個在下午塞車,一大筆的GPS航跡若不經過處理很難看得出塞車(Wang et al., 2013),但經過適量處理後,不但可以發掘城市中的塞車樣態,可以了解市民的生活動態。

圖3:在米蘭一週中的GPS航跡之時空間分佈(Andrienko et al., 2011)
圖4:以時空間群聚分析從GPS航跡中歸類出有意義的事件(Andrienko et al., 2011)

 

圖5:利用GPS航跡以時間空視覺化分析北京市塞車樣態(Wang et al., 2013)

價值: 地理學研究再進化

自願性地理資訊帶來許多探究真實世界的可能性,而知識發掘與資料探勘的方法則是允許研究人員從資料中挖掘出知識的方法,利用合適的方法從自願性地理資訊中挖掘知識則為地理資訊科學帶來另一個視野,讓我們有可能更深入地了解人與環境的交互影響、區域特性和人文自然現象的空間分佈,即是應用知識發掘與資料探勘於自願性地理資訊的價值。

參考文獻

  1. Andrienko, G., N. Andrienko, C. Hurter, S. Rinzivillo3, S. Wrobel1 (2011) From Movement Tracks through Events to Places: Extracting and Characterizing Significant Places from Mobility Data, Proceeding of IEEE Symposium on Visual Analytics Science and Technology, pp.159-168, October 23 – 28, Providence, Rhode Island, USA
  2. Bergman, C. and J. Oksanen (2016) Conflation of OpenStreetMap and Mobile Sports Tracking Data for Automatic Bicycle Routing, Transactions in GIS, 2016, 20(6): 848–868.
  3. Goodchild, M.F. (2007), Citizens as sensors: The world of volunteered geography, GeoJournal, 69 (4): 211–221.
  4. Haklay, M (2010) How good is volunteered geographical information? A comparative study OpenStreetMap and Ordnance Survey datasets, Environment and Planning B: Planning and Design 37:682-703.
  5. Liu, X. and Y. Long (2015) Automated identification and characterization of parcels with OpenStreetMap and points of interest, Environment and Planning B: Planning and Design, 43(2): 341–360.
  6. Mennis, J. and D. Guo (2009) Spatial data mining and geographic knowledge discovery – An introduction, Computers, Environment and Urban Systems, 33: 403-408.
  7. Wang, Z., M. Lu, X. Yuan, J. Zhang, and H. van de Wetering (2013) Visual Traffic Jam Analysis Based on Trajectory Data, IEEE Transactions on Visualization and Computer Graphics, 19(12): 2159-2167

[1]群眾外包(Crowdsourcing)一詞是傑夫×豪伊(Jeff Howe)於2006年《連線》雜誌中所創造出的新詞,這個詞說明了當時正在發展趨勢,即是企業或組織的工作透過網路向廣大的群眾邀請,來提出解決問題想法(例如,因應氣候變遷的對策)、提供資源(例如,照片)、甚至簡單的勞務(例如,收集資料),最後,企業或組織聯合群眾一起共同地完成工作。群眾外包和外包(outsourcing)不一樣,外包(outsourcing)是將特定工作指派給特定的企業、組織、或個人,雙方會有一定的勞雇關係,而群眾外包是邀請廣大的群眾參與工作,強調協同合作的夥伴關係,參與者常常是自願者,也有可能得到一些回饋。

 

TGOS不進化嗎?! 從ISO 19115到GeoDCAT的鏈結資料

就目前國際潮流而言,為方便地提供開放資料,許多政府紛紛建立資料平台讓人民可以取得開放資料,基於分散式管理的概念,多數政府資料平台的架構不僅是一個資料儲存庫(Data Repository),也是一個資料目錄服務(Catalog Service),在此系統架構下,資料本身並不一定得要儲存於唯一的資料平台,而分散地儲存於各資料平台中,但資料集的銓釋資料可以彼此交換,讓使用者透過一個資料平台即可瀏覽和查詢到所有資料,因此銓釋資料能提供愈完整的資訊,則使用者能在資料平台找到所想要的資料之機會愈高。

在詮釋資料在開放資料平間交換的部份,開放資料管理平台CKAN,一套廣為被許多國家開放資料平台所使用的開源軟體,其中「資料採集(Harvest)」的模組支援了由其它平台收存銓釋資料的功能,此模組本身因整併pycsw套件,因此可處理ISO 19115標準的詮釋資料,並可將地理資訊平台發佈的標準詮釋資料,自動地搬移到CKAN的開放資料平台,而美國開放資料平台(data.gov)即是採集了過去美國聯邦政府的地理資料平台(GOS)中的目錄資料,而將地理資料目錄整併進開放資料平台,此外,CKAN也支援W3C資料目錄語彙 DCAT (Data Catalog Vocabulary) 的採集。

隨著開放資料平台的增加,因應資料目錄的交換,使用標準銓釋資料於開放資料的需求因而隨之增加,銓釋資料遇到的問題不僅在於多個平台,且是不同類型的釋銓資料之管理。基於各知識領域的使用方式,可能都存在各自的銓釋資料標準,如地理空間資料是以ISO 19115為銓釋資料標準、電子化政府資料和圖書資訊資料是以都柏林碼(Dublin Code)、而生態資料是以生態銓釋資料語言(Ecological Metadata Language)做為標準,因此英國愛爾蘭數位企業研究所(Digital Enterprise Research Institute, DERI) 在2010年左右建立了「資料目錄語彙」(Data Catalog Vocabulary, DCAT),被先W3C 電子化政府同好群(eGov Interest Group)納入討論並修改,最後被政府連結資料工作群(Government Linked Data working group) 標準化,於2013年被W3C發佈為標準。

在DCAT於開放資料平台的應用方面,相較於英美而言,歐盟的投入較為極積,這是因為歐盟的開放資料平台需要整合來自各國所提供的開放資料,為解決資料在於跨平台的互操作性問題,歐盟在2013年即發展出DCAT應用綱要(Application Profile),就而空間資料而言,歐盟空間資訊基礎設施(INSPIRE) 要考量的不只是各國地理空間資料的整合,還有地理空間資料與其他類型資料的相容性問題,他們相對積極地企圖以DCAT來整合各國資料平台之內容,並對映地理資訊銓釋資料標準(ISO19115/19119)和DCAT語彙,而發展出以地理空間資訊為主的資料目錄GeoDCAT。2015年5月 聯合國全球地理資訊管理委員會(UN-GGIM)在葡萄牙里斯本舉行的專家會議中,對於統計資料和地理資料的連結之問題中,提出以利用DCAT的解決之道,也就是將統計資訊銓釋資料標準 (SDMX) 和DACT對映,並推導出StatDACT,加上GeoDACT,讓二項釋詮資料的描敘都是以DCAT為核心,但保留對特定領域資料的描敘,使DCAT成為一個大架構來整合二種不同性質資料的想法(UNGGIM, 2015)。

圖1: DCAT語彙之UML關係圖 (Source: https://www.w3.org/TR/vocab-dcat/)

DCAT是一個RDF語彙,用來使發佈於網路上資料目錄能夠達到資料的互操作性,DCAT為W3C的銓釋資料標準,利用DCAT 在語彙描述資料集,可以使應用程式能容易地消化不同知識領域的銓釋資料,並使資料發佈者增加所發佈資料集在網路中被尋找可能性,再進一步地,DCAT可使資料目錄的發佈更為去中心化,促進跨平台的聯合式(federated)資料集搜尋的可能。DCAT語彙 包含三個主要類別(classes),如圖1,分別為dcat:Catalog, 用來表達一整個資料目錄; dcat:Dataset, 用來表達一目錄中的資料集; 以及,dact:Distribution 用來表達資料集的可及性方式,例如以下載、RSS或網路服務的方式來提供資料集。另一個重要的類別是選填的,dcat:CatalogRecord 是用來描述一資料集在資料目錄中。DCAT、GeoDCAT和ISO 19115的對映與討論,可透過歐盟網站上文件來了解,並可設計一套轉換的程式,自動將本來為以XML編輯的ISO 19115語彙轉成RDF編輯的GeoDCAT,也就是將銓釋資料轉為四星級資料。

圖2‭: ‬TGOS資料「座標對位影像五萬分之一分幅地質圖‭ ‬‭(‬頭城‭)‬」之銓釋資料
圖3‭: ‬以平溪「火燒寮」在TGOS上無法查詢到相關圖資

在這個ISO 19115語彙可轉換成GeoDCAT的語彙的條件成立下,接下來可以討論以ISO 19115為銓釋資料標準的TGOS,如何在四級星的開放資料下擴展為五星級的可能。以TGOS中「座標對位影像五萬分之一分幅地質圖 (頭城)」為例,其銓釋資料如圖2所示,這個案例著重於在這銓釋資料中二個的項目,分別是關鍵詞和圖資的空間範圍,如圖2所示,其空間範圍為:

最西經度值 gmd:westBoundLongitude:121.748481 ;
最東經度值 gmd:eastBoundLongitude:122.002055 ;
最南緯度值 gmd:southBoundLatitude:24.748512 ; 和
最北緯度值 gmd:northBoundLatitude:25.001564。

利用此一圖資的四極座標範圍,查詢地名資料庫,可得到177筆地名,涵蓋新北市的坪林區、平溪區、貢寮區、雙溪區、和宜蘭縣壯圍鄉、宜蘭市、礁溪鄉、頭城鎮,若這171筆地名皆成為該筆資料的關鍵詞,那TGOS在查詢資料時,則可以查詢到該筆資料,反之,則無法讓使用者利用地名,這種便於人們查詢地理資料的語彙,在TGOS中來查詢圖資料,如圖3所示,若以上述圖資四極座標範圍中的地名之一 「火燒寮」來查詢TGOS,其實無法找到相關圖資,但若是先前將圖資四極座標範圍和地名,或相關資訊做一關連後,再補充該筆資料的銓釋資料,則可增加資料被查詢到的可能性與向度。 此外,可以接續地名連結資料的處理,以達成TGOS資料的五星級。

地圖防盜

在紙圖盛行時代,為防止地圖被競爭對手盜用,因此會在地圖中夾雜一些不為人知的符號或註記來區辨出地圖是來自於自家之手,紐約州有一個虛構地名 Agloe,自1930年代就出現,其實就是製圖者所假造的一個地名,一個copyright trap。但有趣的是,USGS 還是收錄它於地名資料庫中,且Google Map也可以找得到 (Agloe General Store)!

Agloe Best

藏在公車站牌中的地方記憶

因應都市發展,有些地標搬遷或消失,例如阿波羅大廈、聯合報大樓,台北市政府在今年(2015年)3月中頒佈了新版的公車命名方式,即是朝向於街道系統以為主的公車站牌命名。這個方向有好有壞,好的地方是街道系統跟著公車站牌方便搭乘的人區分位置,但街道系統已經是充滿了中國地名[註一],公車站牌也是用一堆中國地名再堆砌一次,台北市就充滿了濃濃中國特色。而目前捷運站的命名也存在這樣的趨勢,公車站牌密度如此高,真的要以這種方式命名嗎?

公車站牌事實上隱藏著地方的記憶,這些記憶也有可能隨著公車站牌以街道系統的命名而消失,可以看看幾有趣的例子:

  1. 社子臨江園。根據維基百科,社子島在早期設有「蔬菜專業區」,在沒有大量化學肥料的年代,使用的是水肥,於是在今日的延平北路七段附近,水肥處第一隊設立分隊,利用淡水河運,收集來自於台北市區的水肥,以供應社子島的農業使用。根據王志文(1998)「滄海桑田話社子」一書中記載,後來公車由台北市區向社子島開通之時,要設立公車站牌,當地居民覺得「水肥隊」不好聽,所以取了一個優雅的名字,「臨江園」。本來以為這是一個餐廳之類的地方,居然隱藏一段故事。
  2. 北投八勝園。循著Google街景圖左看右看,就是找不到明顯的建物或地標,對映這個站牌。後來,再以Google查詢,結果發現八勝園是日治時代有名的溫泉旅館,但國民政府來台後被軍方徵收使用,多次整修外觀早已和以前不同,但當地居民仍然習慣使用這個名稱來當公車站牌。
  3. 三重中正堂。以前是活動中心,是當時年輕人聚會的場所,但後來改建為新北市立圖書館三重分館,而公車牌站也沒有換,所以利用Google查詢三重中山堂,會直接出現圖書館,和附近的美食,表示「中正堂」並沒有被後來的圖書館取代,成為當地人的新地標。

隨著都市化過程,公車站牌是有調整的必要,但可以考慮一個比較完整妥善的方式進行,對於有意義的站名不一定要完全抹滅吧!

[註一]根據龍應台的《大江大海 一九四九》一書記載,台北市的街道之所以會這麼中國,是由於上海建築師鄭定邦,沿用了上海市的街道命名方法(這個命名方式是為了擺平各國在上海租借地的命名爭論),而大量使用中國地名,把過去日治及日治之前所遺留下來的地名記憶抹滅。

[OSM活用術]如何安裝在開放街圖(OpenStreetMap)在Garmin的機台

在台灣買GPS機台,多數只會裝台灣的圖資,而出國時經常面臨有GPS機台沒有圖資使用的窘境; 相反地,在國外買的機台也只裝載當地圖資,往往回台灣後,也會面臨沒圖可用的狀況,就必須再額外購買圖資。其實,開放街圖(OpenStreetMap)提供了一個免費的圖資。

隨著OSM的圖資在世界各地愈來愈完成、豐富,提升OSM圖資實用性。Garmin 目前是GPS熱門廠牌之一,使用者多,在OSM社群中自然有人已經把OSM圖資轉為Garmin機台可讀的IMG檔。以目前還在更新維護的Garmin圖資載點,如圖1所示,是由荷蘭人Lambertus所維護,可以自由地選擇所需圖資之區域,下載該區域的IMG,再置入Garmin的機台,就可以使用。

http://garmin.openstreetmap.nl/
圖1: 可下載Garmin機台可讀的OSM圖資 (garmin.openstreetmal.nl)

步驟很簡單,在圖1中,可以選單方式選擇所需區域,或者勾選手動的方式,選定一個或多個區域,筆者只需要越南河內,因此只選擇河內單一區域,然後填上你的email,按下”Build your map”,如圖2所示,系統會自動產生你所需的IMG檔,並email給你。

Garmin OSM region selection
圖2: 選撢所需圖資之區域

隨著email所提供的連結,來到如圖3的網頁,其中”osm_generic_gmapsupp.zip “,就是可以載入Garmin機台的IMG檔,如果你的電腦上有裝Garmin出產的地圖瀏覽工具,也可以下載在這個頁面中所提供的其它檔案。

Screen Shot 2015-10-08 at 6.20.20 PM
圖3: 經由email提供的連結下載圖資

將IMG修改一下檔名,以免覆蓋掉原本圖資,放上Garmin 機台的資料夾。開機後,縮至使用的地圖區域,如這次範例是在河內,縮到河內,就可以看到OSM的地圖。如圖4。

OSM in Garmin Dakota 20
圖4: OSM圖資在Garmin Dakota 20

開放與機密!? 一個「鳥」看法

因為601旅所在的龍潭機場並非要塞堡壘地帶,15人的貴婦觀光團不被起訴,但同樣地,鈕承澤拍攝電影,因勘景需求,「申請」進入高雄軍港,而中國籍攝影師因未在名單之內,卻因鈕承澤為演藝知名人士,海軍接待人員不疑有他,讓中國籍攝影師混在這行勘查團中,進入高雄軍港,結果因違反「要塞堡壘地帶法」第10條第1項之非法出入罪,處有期徒刑5月,緩刑2年,並應向公庫支付新臺幣60萬元,加上60小時之義務勞務。這之間差別在於被造訪的地方是否被劃為要塞堡壘地帶,但有多少地方被劃為「要塞堡壘地帶」呢? 這個問題只能問國防部,根據蕃新聞中有一文章寫到

根據檢調掌握的資料,目前涉及「要塞堡壘地帶法」中範圍包括本島基隆、新北、新竹、花蓮、台東、高雄6處,其餘則為外島的金馬、澎湖等地。
由於「要塞堡壘地帶法」的認定範圍,不能全然由檢方認定,因此必須要函詢國防部等相關單位確認。

而吊詭的是,在阿帕契案爆發時,601旅所在的龍潭機場是否為要塞堡壘地帶法所認定之範圍,就有網友打臉國防部,在行政院公告「龍潭、新社、頭嵙山、歸仁及左營等5處軍用機場周圍禁止飼養飛鴿距離範圍」之中,即是依照要塞堡壘地帶法來禁止機場周遭的養鴿,但最後法院無法起訴這15人是因為國防部根本沒把龍潭機場劃定為要塞堡壘地帶,那之前的公告是怎麼回事?

國防部對於要塞堡壘地帶法所劃定的區域是否應該讓國人充份了解,以免沒事去釣魚也可能觸闖要塞堡壘地帶在民用機場拍照也可能被抓也不能隨便拍軍機 … ,軍方只要不讓你看、不讓你知道,就用一個過時的法令來恐嚇人民,遇到權貴之時,這些法令反而成為保護傘,不免讓人質疑,這塊國防布果然是遮腐蓋爛、而不防機密,國防部很鳥、塞堡壘地帶法也很鳥。

而真正「鳥」的觀點是,是從空中看來這些存放國軍精良武器的軍事基地,以當代民用衛星航空的科技,要把軍事基地看的一清二楚根本不是什麼難事,故意把地圖留白,就可以隱藏基地嗎? G社所提供的衛星影像中,龍潭基地清楚可見,但在農林航測所提供的航空相片圖,則是挖空了一塊,再來看看OSM和G社的在龍潭基地附近的地圖,G社地圖以前是台灣民間製圖商提供,對於軍事用地依照OSM把基地範圍、跑道、和建物都揭露了,在阿帕契案前,對於軍事設施的製圖,都盡量不主動提起,避免麻煩上身,但阿帕契都是農村設施了,有什麼好忌諱的,我們只是畫畫軍事基地的農村設施罷了!

再者,臺灣地區基本圖測製管理規則 在2003年就己經廢止,現行法令國防部是什麼法令限制軍事用地的繪製呢? 國家安全法? 國家機密保護法? 但貴婦組團就能進入了,還有機密可言? 國土安全也只不是FB照片讓人按讚的理由。

Screenshot 2015-08-23 11.08.17TG-96224060-4
Screenshot 2015-08-23 11.16.23

資料開放是不能涉及國防安全,這個道理誰都能懂,在談地理空間資料的開放時,往往遇到要問國防部,事情恐怕就是GG。但對於什麼是國防機密的認定,感謝貴婦團一行人突破重圍,讓我們了解,很多本來被認為有危及國家安全的規定,其實國防部並沒有這麼要求,但行政機關還在以舊有法令來威嚇人民!?

那什麼樣的地理空間資訊開放會危害國家安全? 什麼是資料是機密? 國防部有能力判斷嗎? 阿帕契儀表板未通電下,拍照po網是否構成洩密,國防部自已也不確定,還得老美說沒問題,才由法院判定不起訴。同樣的道理,以當代資訊科技發達,國防部是否能掌握新興科技的發展,而有防治策略呢? 話說,2公尺解析度的數值高程模型(DTM)是機密資料,而5公尺解析度的數值高程模型(DEM)則是一般公務機密,精細的地表高程資料,可以提供彈道計算,提高飛彈命中目標機率,然而這個理由成立嗎? 花點錢,在日本或國外的一些公司行號,就可以買到5公尺等級的數值高程模型(DTM),再者,對岸的中共,衛星技術並不差,這些資料共軍無法自己生產嗎? 那國防部管制的理由是什麼呢?  還是一切以跳針式的回應,「不可以!、不可以!、不可以!」,問為什麼不可以,回答依然是「就是不可以!」 ,這種愚民式策略,在當代開放政府的風潮下,這種處理方式,只會突顯自身能力的崩壞。鳥!

 

一個智慧‧各自表述

行政院正推動「網路智慧新臺灣政策白皮書」,日前參加了智慧國土分組第二階段實體會議,才了解整個想法根本就是舊酒裝新瓶,一堆過去的報告書的重組,看到一堆令人匪疑所思的問題。

如果核心議題在於如何從網路新型態互動過程過中得到智慧,使政府治理更有效能,那為什麼智慧國土的核心是永續國土? 既使是永續國土好了,那如何透過網路互動模式使國土永續呢? 這個根本性的問題影響了整個智慧國土構面的架構與論述。因為接下來的三個推動項目是「智慧防災」、「智慧運輸」、和「智慧城鄉」,根本就是「一個智慧,各自表述」,看起來就像三個推動項目中所涉及的各政府部會,將熟悉的職掌業務中,湊出來的一份白皮書,集合了一堆和網路有關係的關鍵字,如IOT、雲端、和群眾外包…等等, 但空泛的文字,整份報告書看不出來要解決問題是以什麼為本?

舉個例子來說,在智慧防災中提到「利用網路與通訊科技,結合政府與民間力量,來提高防災、抗災與救災的能力」,在這個白皮書的脈絡中指的「民間」應該是誰? 不再是過去所認知的民間了吧!? 既然是網路智慧新臺灣政策白皮書,這個「民間」就應該包含網路社群,甚至是以網路社群為主體,那問題就來了,結合政府與民間(網路社群)絕對不會是單純的只有網路與通訊科技,難道政府發給民間(網路社群)每人一支4G 手機,且保証4G覆蓋無死角,還是衛星電話,大家發生災害時可以馬上打電話呢?

民間和政府的協同合作的基礎是在於開放與透明,也就是構成開放政府的要件,加拿大政府更是以開放指令和授權為基礎,來達到開放資料、開放對話、和開放資訊,藉由這三個管道,使得資料可取得、公民可以參與、新技術可以介入、且專業可以完整。回過頭來,如何透過開放、透明的基礎,公民參與政府公共事務, 協助政府解決問題的同時,也增加政府治理效能,使民眾得到更多便利或得到更好的生命財產保障,才是防災、運輸和城鄉具有智慧的基礎,不是嗎? 再者,內容也提到「運用物聯網科技,提升對災害應變的能量即時訊息的快速傳遞」。其實談IOT,或是Sensor web,還是無法摒除開放,若資料不是開放的,沒有結構化,如何架構出機器對機器相互交換資料的環境? 所以撰寫白皮書的人到底了不了解IOT,或是Sensor web呀~~~~~~

其實我一直很不解,無論防災、運輸、或城鄉都大量使用地理資料,也都應當以國土地資訊,或是說時空地理圖資雲為基礎,而且NGIS2020計畫也即將完成,但這二個部份和智慧國士中三個推動項目的關係是如何? 如何把地理資料充份整合,以支援三個推動項目? NGIS2020對於眾群協同合作也都有規劃,那這部份和三個推動項目所要進行的事的關係為何? 如何相互支援? 這難免讓我想到,內政部資訊中心和國發會國土處有什麼問題嗎? XD

來一場超級杯的地理資料視覺秀!

之前使用過Torque去呈現台灣地區OSM的2012年中編輯的歷程

沒想到CartoDB自已做的案例更酷了! 利用2015年SuperBowl期間的Twitter資料做一場資料秀,其實資料的處理不難,先在Twitter API上取出了含有#SB49的推文(tweets),區分出是新英格蘭愛國者(@Patroits)和西雅圖海鷹(@Seahawks),藉由推文(tweets)上帶有的xy座標,就可以將推文定於地圖上。當然,因為使用CartoDB所推出的Torque.js,這些資料必需匯入CartoDB,而這就是CartoDB的商業模式,它提供很好的地理視覺化工具,但資料量大或瀏覽量高時,就必須收費了!

這場超級杯的資料視覺秀,很有趣!

在18:30開場時,綠點海鷹充滿了西雅圖,而紅點的愛國者則聚集在新英格蘭,一開始就有地域上的差 異。

Screenshot 2015-02-11 17.45.24

在19:13時,新英格蘭首度觸地得分,頓時紅成一片。而19:36時,換海鷹得分則整個變成綠色。比分7:7平手!
touchdown_patriots#SB2015touchdown_seahwaks#SB2015

後來雙方再各得7分,在中場時,還是14:14的平手局面。而超級杯一直是美國本土收視率最高的節目,今年(2015)還破了最高收視率,而中場秀一直眾所矚目的焦點,廣告收益頗為驚人,然而,Katy Perry(@katyperry),我實在不認識,冏! 但從推文的量看得出來她果然是推特(Twitter)關注度高的女星。

@katyperry#SB2015

這場比賽非常戲劇化,海鷹和愛國者一路互有得分,但第四節前,海鷹一度是領先10分,但愛國者在第四節一路追趕,逆轉局面,雖然在終場前,海鷹落後3分,但球權在海鷹手中,且已經來到Goal line前不遠,只要一個touch down就完全翻盤,但關鍵出現在最後的26秒,受國者的菜鳥Malcolm Butler,居然抄掉海鷹四分衛 Rusell Wilson的傳球,而斷送海鷹的一線生機。因此,終場雖然是愛國者贏了比賽,海鷹的球迷幹譙聲浪應該不小,使得顏色有點慘綠了 XD! 整場的Highlight在Youtube,可以看得到,透過這樣地理視覺化,更讓人可以了解到球迷的動態。

Mac_BZ#SB2015