2016年歐洲資料論壇(European Data Forum 2016)與會記行

1.歐洲資料論壇的背景

歐洲資料論壇(European Data Forum, EDF) 是每年一次的會議,聚焦在以資料為主的多個面向,如社會、經濟、研究、工程、和科學等,並著重於歐洲的資料趨動經濟之提昇,該會議自2012年起開始舉行,是由歐盟執委會(European Commission)中,連結的數位單一市場(Connected Digital Single Market)計畫下主導,但會議行政管理是由歐洲各國產官學相關人士組成指導委員會來執行,以確定每年會議主題與內容、目標、及預算支配,且評估歐洲各國提出舉辦會議的申請。

這二年的主題都以資料經濟(Data Economy)為會議主軸,來貫穿4個主題,

  • 巨量資料(Big Data),如何利用新的科學和工程方法,有意義的處理大量資料,
  • data_economy開放資料(Open Data),如何透過跨部門資料整併,以支援決策制定,提昇政府治理的透明度,
  • 鏈結資料(Linked Data),如何將鏈結資料技術與方法做為普遍的資料整合平台,
  • 由資料產生的價值(Data-driven value),由前三者去審視資料能產生的價值,並研析資料趨動經濟的方法和工具。

而基於數位經濟和數位化社會(Digital Economy and Society)的發展,會議本身也關注三個面向的發展,

  • 技術面,如何駕馭現今如此大量的、異質的、和動態的資料,面對這樣的資料世代,科技和基礎建設會是什麼樣貌?
  • 應用面,因為開放資料、鏈結資料、和巨量資料的快速發展,可能的新產品和服務會是什麼?
  • 社經面,在這個新的資料世代中,社會衝擊、法律問題、政府政策法規、商業模式、和創新方式的改變會是什麼?

歐洲資料論壇(EDF)是一個聚集歐洲各國的產官學人士,共同討論資料趨動創新的機會與挑戰的重要會議。所謂的資料趨動創新的機會與挑戰是著重在資料的基礎設施、工具、應用程式的發展潛力,及其所面臨之問題,因此資料趨動創新特別重視創新所可能帶來的社會和經濟面的影響。EDF這個會議所企圖吸引的參加者,是涉及資料價值鏈中的利益關係者(stakeholder),無論是從巨量資料技術方法之應用到創新想法的突破,或者是,各項進行中之政策的辯論到前瞻思維的演講中獲得啟發,在EDF中的意見與想法的交換,是會議的價值,這將為歐盟各國在未來資料經濟之研究課題的設計,和政策決定的方向上帶來影響,這即是推動資料趨動創新往前動力,強化歐洲資料經濟的力量,也是奠定歐洲資料經濟在全球地位的基礎,因此這屆的EDF將主軸定為 Scaling up the European Data Economy,換句話說,資料經濟的議題在歐盟並不是新的開始,而是進入到擴大並強化各個領域在資料經濟的應用規模。

By Rijksdienst voor het Cultureel Erfgoed, CC BY-SA 3.0 nl, https://commons.wikimedia.org/w/index.php?curid=37243214

本屆的歐洲資料論壇(EDF)是由荷蘭埃因荷芬科技大學(Eindhoven University of Technology )中資料科學中心(Data Science Center Eindhoven (DSC/e)) 肩負起主要籌辦的角色,因此會議舉辦城市即在荷蘭埃因荷芬,該城市即是一個工業城,是許多知名企業的根據地,如菲利浦、NXP、ASML…等,值得一提的是城市行銷是以Brainport為主題,有別於鹿特丹的海港和阿姆斯特丹的空港,所謂的Brainport即是集合整個區域的公司企業、大學、和研究中心,成為一個創新研發的城市,這樣的策略倒也很符合EDF主軸,是強調資料趨動的創新下的經濟動能。

而會議場館Evoluon則是一個很特殊外觀的建築物,這個飛碟造型的場館是原本是當地的科學館,在1966年就落成,已經有50年的歷史,後來成為菲利浦的會議中心。

2.會議內容

2.1.真槍實彈的鍵結資料應用

EDF2016會前有幾個工作坊和活動一同在Eindhoven舉行,巧好會議前一天(6/27)的早上看到有一個活動是荷蘭鏈結資料平台(Platform Linked Data Nederland)舉辦的荷蘭鏈結資料會議,在沒有事先報名的情況下就直接殺去會場,結果主辦單位很包容地讓我參加了會議,結果會議還沒開始就遇到老朋友,Simon Scheider,目前在烏特列支大學(Utrecht University)地理系任教,仔細一看,他上下午各有一個演講,一個是講的是地理資料在進行跨資料集連結時,如何除錯、確定地理實體的型別、正確的相互連結的工作流程,另一個是講鏈結資料和空間分析整合的潛力。更有趣的是,下午有一個講者居然是我的指導教授Rob Lemmens,他的演講是在介紹歐盟的一個計畫ENERGIC Project 中如何利用自願性地理資料進行Datathon,這真是太巧了!

其實會議中有一個案例很吸引我,講的是半導體企業NXP和Freescale合併時,產生資料整合的問題,雖然二個企業體都是做半導體,各自企業的資料架構是不同的,因此在企業整併的過程出現資訊系統整合的難題,為了解決這樣的困境,他們選擇使用鏈結資料的技術和方法來整併二家企業的資料,這個工作是由Semaku這家工公司承接,最後NXP和Semaku根據這樣的經驗建立了一個 NXP Enterprise Data Hub,這個鏈結資料的應用在去年接連拿到荷蘭鏈結資料應用的首獎和歐洲鏈結資料首獎

 2.2.企業善用資料,開創新商業模式

edf2016

由Keynotes的結構來看,這個會議確實是秉持產官學互動交流的原則,在8個Keynotes中有4個是來自於業界的分享,菲利浦總裁 Frans van Houten介紹自家許多家電產品已經收集消費者的使用行為資料,分析資料可以提供更好的服務,例如,電動牙刷利用藍芽和手機連結收集使用者的刷牙方式,若有使用者刷牙方式錯誤,手機應用程式可以自動提醒。西門子數位工廠部門工廠資料服務資深副總 Ralf Wanger則是介紹西門子賣出的機器中裝有感測器(sensor),可以消費者可以將機器連結上西門子的資料服務中心,系統可自動分析維修時間,並自動安排員工進行檢修。導航和地圖空間資料服務的知名公司TomTom之總裁Harold Goddijn 則是分享公司跨界轉型過程,單純買圖資或GPS導航的獲利已經不高,TomTom已將圖資應用在支援無人車研發。知名線上音樂公司Spotify,資料分析主任Andres Arpteg 以資料科學的角度來了解消費者使用行為,他們利用資料探礦的方法分析了解消費習慣以提昇音樂平台的服務。

第一天下午和第二天有三個時段各有三個平行的場次,主題分別是Automotive, Data-Driven Government, Agrifood, Urban Smart Living, Smart Industry,Novel Emerging Areas, Educations and Skills, Healthcare, 和 Media,這9個場次的講者來源,有政府官員、非營利組織、大學及科研中心,更有來自公司企業,不同領域在同一主題上所面臨的問題可能不一樣,但在同一個場所的討論則有助相互交流和經驗分享,與會者中有許多是來自於歐洲的中小型企業(SMEs),藉由研討的過程,他們有機會提供他們的技術與經驗和講者交流,也就創造他們參與大型計畫,以及和大型企業合作的機會。

2.3.政府部門主導資料經濟政策的制定img_0721

會議中有二個歐盟政府官員的Keynotes,都與EDF的組成有關,一個是來自歐盟執委會 在數位經濟和文化的專員,以錄影方式發表演說,另一個是Márta Nagy-Rothengass 歐盟網通科技總署 (DG Connect) 中資料價值鏈部門的主任,以「 Building a data-driven economy – The perspective of the European Commission」為題演說。

img_0722她的演講中清楚地勾勒出歐盟在資料政策上制定與推行,在多國組成的歐盟,不同制度文化下,資料的管理方式不同,造成資料整合應用上的障礙,一直是歐盟成立以來著重的問題,隨著開放資料、巨量資料和資料科學的風潮,歐盟也逐漸地在過去電子化政府運作中做出改變,開始著重於建立一個有效率的資料生態系統,朝向政府、科研、企業、公民等不同角色的公私部門夥伴(Public-Private Partnership)的合作架構,以促進資源與利益的共享、責任的共同承擔、並著重社會層面議題。

為了建立這樣的資料生態系統,開放資料的策略變得很重要,因為資料能開放地被近用,才有可能讓資料在不同的角色中相互流動,資料有流動就增加應用加值的可能性,在這樣的脈絡下,開放資料被視為資料經濟的一部份。因此歐盟不但極積的建立歐盟開放資料平台,2012年啟動,一開始只有歐盟本身的資料,去年(2015年)起開始要求各國開放資料匯入,另一方面也極積地調查歐盟資料市場的規模和潛力,透過歐盟經費補助,委由國際數據資訊(IDC)和Open Evidence 進行歐洲資料市場的調查,報告書在2015年發表,同時他們也建立了一個資料視覺化的工具,European Data Market Monitoring Tool,可瀏覽歐洲的資料市場情況。

2.3.學研機構提供資料治理的策略

img_0624

在Data-Driven Gvoernemnt場次中,JOHANN HÖCHTL 發表Performance-indicator based policy-making in Austria

會議中的展覽單位和參展海報中,不少是歐盟計畫的成果,如IQmulus,仔細調查可以發現,歐盟執委會在推動資料經濟,並不是單單只有制定政策,且提供許多經費給科研單位進行長期的研究,這些科研計畫是以解決問題為導向的研究,並重視跨國、跨領域間的協同合作,這些計畫過去也都參加過之前的EDF,在歐盟的網頁上可以看得到這些計畫

在Data-Driven Government場次中,有4個演講,除了論述政府如何應用資料治理的策略與方法,也包含了實務面的處理,荷蘭如何應用資料分析改善交通問題,奧地利如何運用開放資料制定指標以決定政策,法國如何透過培育計畫培殖更多資料科學人才。

fhg_193_ids_grafiken-eng-03Sören Auer是Fraunhofer IAIS 企業資訊部門主任,也是波昂大學企業資料系的教授,他在Smart Industry以Industrial data space digital sovereignty over data為題發表演說,提出 Industrial Data Space 是一個利用資訊標準和共同治理模式建構出一個虛擬的資料空間 ,這個構想之目的在於嘗試在商業環境中,讓資料的交換更安全且資料的連結更容易,這個構想想建立的系統也試圖提供一個基礎,以建立和使用智慧服務和創新商業流程,使得資料擁有者以確保他們的資料治理權 (digital sovereignty)。

透過使用情境,可以了解Industrial Data Space的架構和需求,這架構是在於創造資料價值鏈,以及調適以特定領域中鏈結資料的語彙以輕量化的語意表達,Industrial Data Space廣大地支援不同領域的情境,同時,也是下一代的工業生產 (工業4.0) 可以應用的範疇。此外,他也指出 Industrial Data Space 也是一個跨領域組織,包含商業、政府、和科研單位,於2014年底在德國成立,這個組織的目標清楚企圖建立一個歐盟、甚至是世界級的平台。

2.4.重視巨量資料科學研究、應用、與人才培育

EDF2016中二個Keynotes是來自於埃因荷芬(Eindhoven)附近的科研中心,分別是荷蘭提堡大學(Tilburg University)校長Emile Aarts和德國多特蒙德大學(TU Dortmund University)資料科學中心的主任Katharina Morik,他們各自介紹各自資料科學中心如何透過在企業合作以資料科學的方法解決問題,此外,也強調各自資料學中心的能力和潛力,以吸收更多人才的加入。加上埃因荷芬大學資料科學中心,似乎讓我有感覺有一個趨勢,就是這個過去以工業生產為主的區域,已經看清資料價值鏈中,傳統工業轉型後,所要扮演的角色,所以需要的人才,這些資料科學中心成為這個區域進入下一個工業世代的軍火庫,不但提供策略想法,也訓練人才。

3.會後心得

這次EDF的參與者有1070人,來自於48國家,參與人數最多的15國依次分別為,荷蘭、德國、比利時、英國、西班牙、希臘、奧地利、法國、義大利、愛爾蘭、匈牙利、挪威、盧森堡、芬蘭、萄葡牙等,有明顯的舉辦國優勢的傾向,以參與人員的行業類別而言,有40%是來自於工業界,32%是學術界、13%是公部門、和15%的其它,會議參與者多數是來自於業界,但科研單位的人也為數不少,這和我過去參與的學術會議巧好有點相反的情形,因此二天會議談論的事情,多是實務面的工作和面臨的問題,較少生硬的科學理論,相對而言,整體內容是比較能讓一般人進入的。

荷蘭North Brabant省的經濟經理Bert Puali,在會後的宣傳錄影中提到,「…在我們變得談論過多巨量資料的可能性之前,我們應該加入有執行力的那一方,藉由資料和資通訊相關的研究,以了解資料經濟的市場有多大…」,其實這就是EDF的主軸,整個會議雖然扣合歐盟「資料經濟」發展的政策,但不會讓人感到過多政策推動鑿痕,可以讓人感到的是,歐盟對於政策推動是根植於問題與挑戰的認知和了解,接著再提出解決問題的技術方法的一系列進程,反觀國內,通常把二件事情給壓縮了,常在政策推動的過程中,讓人看不清,解決問題的意識和方向是什麼? 而堆疊過多的技術名詞,沒有執行的實質內容,最後流於空洞。

在海報、展覽單位、以及與會會眾中,很多是資通訊產業的中小型企業(SMEs)的員工、甚至是老闆,試圖透過這個會議中尋找合作機會,這與歐盟資料經濟策略中重視中小型企業(SMEs)所扮演的角色有關,個人觀察,這就和公民科技在開放資料生態系中扮演重要角色是類似的,政府或大型企業在面對新問題和新挑戰時,由於組織體系的龐大,未必能及時適度確切的反應,而中小型企業較具有彈性,可以容易調整方向,調度人才,因此大型企業或政府單位和中小型企業合作,較能快速地解決問題,如之前提到NXP和Semaku的案例。

從許多EDF的演講中,可以發現有些研究是歐盟所補助的計畫,這些計畫無論是在智慧城市、物聯網或工業4.0上,都以資料為本,提出解決問題的架構、技術或方法,而這些計畫也不僅是單一科研單位所執行,而是跨國、跨領域協同合作,這種3-5年左右的研科計畫,也提供教育、研究資源,培養更多的人才,因此可以想像的,一個新興議題,如資料經濟,一開始大家都不熟悉,在這樣的情況下可以做出的策略自然保守且限縮的,而在補助科研單位的研究計畫中,利用博碩士生在深入研究推導,研究成果最終成為政府單位政策推動依據,這樣一個階段、一個階段的進行下,歐盟在開放資料、巨量資料、和鏈結資料逐漸形成策略,以面對不斷演變的挑戰,因此提出資料趨動經濟的論述,成為歐盟政策內容,形為今日如此的規模,這絕對不是把堆砌一堆技術名詞而缺乏解決問題方法的報告書重抄一遍,再重新包裝的政策內容。

看到歐盟對於資料相關的政策,反觀台灣,想問的是,面臨新的資料世代,台灣政府對應的政策是什麼?

[OSM活用術]如何安裝在開放街圖(OpenStreetMap)在Garmin的機台

在台灣買GPS機台,多數只會裝台灣的圖資,而出國時經常面臨有GPS機台沒有圖資使用的窘境; 相反地,在國外買的機台也只裝載當地圖資,往往回台灣後,也會面臨沒圖可用的狀況,就必須再額外購買圖資。其實,開放街圖(OpenStreetMap)提供了一個免費的圖資。

隨著OSM的圖資在世界各地愈來愈完成、豐富,提升OSM圖資實用性。Garmin 目前是GPS熱門廠牌之一,使用者多,在OSM社群中自然有人已經把OSM圖資轉為Garmin機台可讀的IMG檔。以目前還在更新維護的Garmin圖資載點,如圖1所示,是由荷蘭人Lambertus所維護,可以自由地選擇所需圖資之區域,下載該區域的IMG,再置入Garmin的機台,就可以使用。

http://garmin.openstreetmap.nl/

圖1: 可下載Garmin機台可讀的OSM圖資 (garmin.openstreetmal.nl)

步驟很簡單,在圖1中,可以選單方式選擇所需區域,或者勾選手動的方式,選定一個或多個區域,筆者只需要越南河內,因此只選擇河內單一區域,然後填上你的email,按下”Build your map”,如圖2所示,系統會自動產生你所需的IMG檔,並email給你。

Garmin OSM region selection

圖2: 選撢所需圖資之區域

隨著email所提供的連結,來到如圖3的網頁,其中”osm_generic_gmapsupp.zip “,就是可以載入Garmin機台的IMG檔,如果你的電腦上有裝Garmin出產的地圖瀏覽工具,也可以下載在這個頁面中所提供的其它檔案。

Screen Shot 2015-10-08 at 6.20.20 PM

圖3: 經由email提供的連結下載圖資

將IMG修改一下檔名,以免覆蓋掉原本圖資,放上Garmin 機台的資料夾。開機後,縮至使用的地圖區域,如這次範例是在河內,縮到河內,就可以看到OSM的地圖。如圖4。

OSM in Garmin Dakota 20

圖4: OSM圖資在Garmin Dakota 20

開放與機密!? 一個「鳥」看法

因為601旅所在的龍潭機場並非要塞堡壘地帶,15人的貴婦觀光團不被起訴,但同樣地,鈕承澤拍攝電影,因勘景需求,「申請」進入高雄軍港,而中國籍攝影師因未在名單之內,卻因鈕承澤為演藝知名人士,海軍接待人員不疑有他,讓中國籍攝影師混在這行勘查團中,進入高雄軍港,結果因違反「要塞堡壘地帶法」第10條第1項之非法出入罪,處有期徒刑5月,緩刑2年,並應向公庫支付新臺幣60萬元,加上60小時之義務勞務。這之間差別在於被造訪的地方是否被劃為要塞堡壘地帶,但有多少地方被劃為「要塞堡壘地帶」呢? 這個問題只能問國防部,根據蕃新聞中有一文章寫到

根據檢調掌握的資料,目前涉及「要塞堡壘地帶法」中範圍包括本島基隆、新北、新竹、花蓮、台東、高雄6處,其餘則為外島的金馬、澎湖等地。
由於「要塞堡壘地帶法」的認定範圍,不能全然由檢方認定,因此必須要函詢國防部等相關單位確認。

而吊詭的是,在阿帕契案爆發時,601旅所在的龍潭機場是否為要塞堡壘地帶法所認定之範圍,就有網友打臉國防部,在行政院公告「龍潭、新社、頭嵙山、歸仁及左營等5處軍用機場周圍禁止飼養飛鴿距離範圍」之中,即是依照要塞堡壘地帶法來禁止機場周遭的養鴿,但最後法院無法起訴這15人是因為國防部根本沒把龍潭機場劃定為要塞堡壘地帶,那之前的公告是怎麼回事?

國防部對於要塞堡壘地帶法所劃定的區域是否應該讓國人充份了解,以免沒事去釣魚也可能觸闖要塞堡壘地帶在民用機場拍照也可能被抓也不能隨便拍軍機 … ,軍方只要不讓你看、不讓你知道,就用一個過時的法令來恐嚇人民,遇到權貴之時,這些法令反而成為保護傘,不免讓人質疑,這塊國防布果然是遮腐蓋爛、而不防機密,國防部很鳥、塞堡壘地帶法也很鳥。

而真正「鳥」的觀點是,是從空中看來這些存放國軍精良武器的軍事基地,以當代民用衛星航空的科技,要把軍事基地看的一清二楚根本不是什麼難事,故意把地圖留白,就可以隱藏基地嗎? G社所提供的衛星影像中,龍潭基地清楚可見,但在農林航測所提供的航空相片圖,則是挖空了一塊,再來看看OSM和G社的在龍潭基地附近的地圖,G社地圖以前是台灣民間製圖商提供,對於軍事用地依照OSM把基地範圍、跑道、和建物都揭露了,在阿帕契案前,對於軍事設施的製圖,都盡量不主動提起,避免麻煩上身,但阿帕契都是農村設施了,有什麼好忌諱的,我們只是畫畫軍事基地的農村設施罷了!

再者,臺灣地區基本圖測製管理規則 在2003年就己經廢止,現行法令國防部是什麼法令限制軍事用地的繪製呢? 國家安全法? 國家機密保護法? 但貴婦組團就能進入了,還有機密可言? 國土安全也只不是FB照片讓人按讚的理由。

Screenshot 2015-08-23 11.08.17TG-96224060-4
Screenshot 2015-08-23 11.16.23

資料開放是不能涉及國防安全,這個道理誰都能懂,在談地理空間資料的開放時,往往遇到要問國防部,事情恐怕就是GG。但對於什麼是國防機密的認定,感謝貴婦團一行人突破重圍,讓我們了解,很多本來被認為有危及國家安全的規定,其實國防部並沒有這麼要求,但行政機關還在以舊有法令來威嚇人民!?

那什麼樣的地理空間資訊開放會危害國家安全? 什麼是資料是機密? 國防部有能力判斷嗎? 阿帕契儀表板未通電下,拍照po網是否構成洩密,國防部自已也不確定,還得老美說沒問題,才由法院判定不起訴。同樣的道理,以當代資訊科技發達,國防部是否能掌握新興科技的發展,而有防治策略呢? 話說,2公尺解析度的數值高程模型(DTM)是機密資料,而5公尺解析度的數值高程模型(DEM)則是一般公務機密,精細的地表高程資料,可以提供彈道計算,提高飛彈命中目標機率,然而這個理由成立嗎? 花點錢,在日本或國外的一些公司行號,就可以買到5公尺等級的數值高程模型(DTM),再者,對岸的中共,衛星技術並不差,這些資料共軍無法自己生產嗎? 那國防部管制的理由是什麼呢?  還是一切以跳針式的回應,「不可以!、不可以!、不可以!」,問為什麼不可以,回答依然是「就是不可以!」 ,這種愚民式策略,在當代開放政府的風潮下,這種處理方式,只會突顯自身能力的崩壞。鳥!

 

來一場超級杯的地理資料視覺秀!

之前使用過Torque去呈現台灣地區OSM的2012年中編輯的歷程

沒想到CartoDB自已做的案例更酷了! 利用2015年SuperBowl期間的Twitter資料做一場資料秀,其實資料的處理不難,先在Twitter API上取出了含有#SB49的推文(tweets),區分出是新英格蘭愛國者(@Patroits)和西雅圖海鷹(@Seahawks),藉由推文(tweets)上帶有的xy座標,就可以將推文定於地圖上。當然,因為使用CartoDB所推出的Torque.js,這些資料必需匯入CartoDB,而這就是CartoDB的商業模式,它提供很好的地理視覺化工具,但資料量大或瀏覽量高時,就必須收費了!

這場超級杯的資料視覺秀,很有趣!

在18:30開場時,綠點海鷹充滿了西雅圖,而紅點的愛國者則聚集在新英格蘭,一開始就有地域上的差 異。

Screenshot 2015-02-11 17.45.24

在19:13時,新英格蘭首度觸地得分,頓時紅成一片。而19:36時,換海鷹得分則整個變成綠色。比分7:7平手!
touchdown_patriots#SB2015touchdown_seahwaks#SB2015

後來雙方再各得7分,在中場時,還是14:14的平手局面。而超級杯一直是美國本土收視率最高的節目,今年(2015)還破了最高收視率,而中場秀一直眾所矚目的焦點,廣告收益頗為驚人,然而,Katy Perry(@katyperry),我實在不認識,冏! 但從推文的量看得出來她果然是推特(Twitter)關注度高的女星。

@katyperry#SB2015

這場比賽非常戲劇化,海鷹和愛國者一路互有得分,但第四節前,海鷹一度是領先10分,但愛國者在第四節一路追趕,逆轉局面,雖然在終場前,海鷹落後3分,但球權在海鷹手中,且已經來到Goal line前不遠,只要一個touch down就完全翻盤,但關鍵出現在最後的26秒,受國者的菜鳥Malcolm Butler,居然抄掉海鷹四分衛 Rusell Wilson的傳球,而斷送海鷹的一線生機。因此,終場雖然是愛國者贏了比賽,海鷹的球迷幹譙聲浪應該不小,使得顏色有點慘綠了 XD! 整場的Highlight在Youtube,可以看得到,透過這樣地理視覺化,更讓人可以了解到球迷的動態。

Mac_BZ#SB2015

 

開放街圖(OpenStreetMap)與政府的合作

政府與OSM的合作應該可以為二種模式,一是政府資料匯入OSM,經由Mappers修改、更新後,再被政府取回,另一種是OSM資料被政府資料庫吸收後,再釋出於社群,後者所收集到的案例,資訊都不是相當明確。以下案例的收集來自於下列幾個:

1. Government to OSM (to Government)

1.1 歐盟 Corine Land Cover匯入OSM

背景:

  • Corine Land cover 資料是由歐盟環境局(European Environment Agency, EEA)匯集各國土地利用分析成果所建立,多數是根據衛星影像所製作,比例尺為1: 100,000,有3個土地使用等級中有44土地使用類型。

授權: 

  • 根據這樣的授權條款,OSM社群認為這份資料集是可以匯入OSM的,在OSM中對於Corine Land cover介紹的wiki page中出現這麼一段句話,As such it can be imported into OpenStreetMap.

授權議題討論過程:

  • 尚未找到歐盟的那個政府單位有想把Corine的資料再取回政府資料庫。

運作方式:

  • 以法國為例,是在OSM中建立一個帳戶(CLCF06),透過這個帳戶匯入,由OSM社群成員與政府主管單位的承辦人一起將資料匯入。並標示資料來源,於source欄中,標示Union européenne – SOeS, CORINE Land Cover, 2006.
圖1: Corine Land Cover 資料匯入OSM後,資料屬性的標記
  • Corine Land Cover資料匯入OSM的問題
  • Corine Land Cover資料較粗,Mappers因為利用Bing Maps的衛星影像來繪圖,OSM可以得到較為準確的土地使用邊界。
  • Corine Land Cover和OSM對於土地使用的分類不一致。
  • 匯入過程不能覆蓋原有正確的資料。
  • 資料如何驗証其正確性。

 1.2. 紐約市政府與OSM合作

授權: 

  • 建物外框線和地址點位是依 2012 Open Data Law 釋出,幾乎是Public Domain,符合OSM  Contributor terms

運作方式:

  • 由Mapbox且是OSM社群的成員,將開放平台中的建物外框線和地址點位資料匯入OSM,Mapbox並負責開發程式去檢測建物與住址資料被修改,定時用email方式通知政府相關單位,如圖2。詳請看Mapbox的blog
圖2: Mapbox開放應用程式定期回報政府部門建物資料在OSM中的更動

1.3. 加拿大自然資源部和OSM的合作

背景: 

  • CanVec 是數位地圖參照產品,由加拿大自然資源部(Natural Resources Canada, NRCan)製作 is a digital cartographic reference product produced by Natural Resources Canada (NRCan),CanVec 起源於加拿大最好的資料來源,以國際慣用的標準向量格式提供了高品質的地形資訊。CanVec是多來源的產品,有之前的國家地形基本圖(National Topographic Data Base, NTDB)和現在的 GeoBase (www.geobase.ca)。CanVec含有超過90種地理地形實體,並組織成11種主題。NRCan希望透過與OSM整合之合作模式,讓OSM Mappers更新政府部門的圖資。

授權:

運作方式:

  • NRCan把CanVec的圖資轉成.osm格式,讓OSM Mappers可以利用OSM的地圖編輯器,如JOSM、Potlatch等,去輸入和修改資料,NRCan會定期比對OSM的資料,以偵測被修改的地方,使政府圖資保持最近的狀態,圖3為合作模式的示意圖。圖4是渥大方華地區NRCan和OSM地圖的一個比較。 
圖3: NRCan和OSM的合作模式
圖4: CanVec和OSM的變遷偵測。灰色為OSM的道路圖,綠色為OSM中沒有的資料,紅色為CanVec沒有的資料

 1.4. 紐西蘭土地資料(LINZ)匯入OSM

背景:

授權: 

  • 尚未找到紐西蘭政府要將匯入OSM的LINZ再取回的相關消息。

 1.5.日本國土地理院「国土数値情報」的匯入OSM

背景:

授權:

  • 尚未查到有國土地理院將匯入OSM的国土数値情報再取回,並匯入政府資料庫的相關訊息,因此也沒有在這方面有智財權和授權上的討論,或是可能有,但是以日文。
  • 運作模式: 由OSM Mappers 自行轉入OSM,但得加”source=KSJ2“的tag,以標示資料來源。

2. OSM to Government (to OSM)

2.1. 海地震災後的製圖

2.2.HOT在蒙古烏巴托促進智慧城市的製圖

參考資料

歐盟如何區分高價值的開放資料?

政府開放資料的推動通常遇到一個問題是,業務主管機關不知道什麼資料應該開放,而資料的使用者則不知道有什麼資料可以被開放,而由再使用資料產生出價值或商業模式,歐盟所做這篇報告「Report on high-value datasets from EU Institutions」,即提供了一個思考的方向。

歐盟開放資料平台(EU Open Data Portal, EU ODP) 扮演的是歐盟及所屬機構的資料開放與資料上架,但資料的主管機關[1]往往不知道應該拿出什麼樣的資料在EU ODP上開放。理論上而言,愈多資料被開放,就愈有價值,但就有限的資源下,資料主管機關在進行開放資料的業務時,若能區分出什麼高價值的資料,而優先開放,是事半功倍,且資料主管機關最想知道的事。

一方面,就資料主管機關的觀點而言,資料集的高價值性是它們有沒有符合下列條件:

  1. 資料是否能促進政府透明化;
  2. 資料的開放是否受到法律責任的約束;
  3. 資料是否直接或間接關係到公共任務;
  4. 資料是否能實現成本降低;
  5. 資料使用的目標群眾之型態與規模。

另一方面,就資料再使用者的觀點而言,高價值的資料集是具有高度被使用價值和被再使用潛力,因此有機會促成下一步(新的)商業模式。

根據二個方面觀點所成的定義,該計畫區分出261筆高價值的資料集,來自於57個不同機關單位,其中144個還沒在EU ODP上架,恰可以根據分析成果,因資料具有高價值,而要求開放,另外的117筆,已經在EU ODP 上架的資料中,有26筆資料集是2星級或更差的資料,應該著手將資料升級為開放格式或進階到連結(linkable)等級。

過去,對於政府應該開放那些資料,許多的重點都在放,資料使用者端的價值或利益,但這個報告帶來的啟發是,政府是不應該站在和人民一樣的角度在看資料開放的問題,資料開放為政府所帶來最直接的「高價值」應該是政府效能提升,如透明化、成本降本和改善公共事務的推動等,應該不是和民間、企業一樣買資料,想著加值的利益,因為這是民間或企業想的事情,我想,這是當前台灣開放資料的徵結。

[1] 原文是用data publisher,但就台灣而言,用資料業務主管機關似乎比較貼近些

開放資料推廣的雜想

什麼是開放資料的推廣? 要怎麼推廣開放資料?應該還有更多可以做的事吧!

1. 除了hackathon,應該還有不一樣的thon,如 ideathon, mapathon, editathon….。

2. 除了APP競賽,更應該強調開放資料混搭的創新。

3. 除了APP競賽的成果,需要更多的開放資料成功案例。

4. 除了政府開放資料,個人、非營利組織(民間社團)、到企業都可以開放資料,從上到下、或從下到上,整合資訊的過程即是推廣。

5. 除了開放資料,如何使用開放源碼處理開放資料更有吸引力。

6. 除了政府補助的開放資料課程,應該還有大學校園的課程、線上課程、工作坊…..等。

7. 除了民間的課程,政府也應該讓公務人員上更多的課程。

8. 除了專業的內容,應該思考如何將有些開放資料遊戲化(gamification)。

開放街圖(OSM)將成為谷歌地圖(Google Map)的最大爭競者嗎?

常有人問起,開放街圖(OpenStreetMap)能不能商業化? 或開放街圖能有什麼商機? 隨著上個月Telenav宣布他們的產品Scout捨棄了與TomTom的合作關係,而轉為使用開放街圖,這個問題似乎有一個強而有力的答案。事實上,不少網路媒體、甚至是紐約時報都認為TeleNav的做法將為適地性服務(Location-Based Service, LBS)和導航產業的市場帶來許多衝擊和轉變,但就一個圖客(Mappers)而言,開放街圖能被一家具規模的導航公司所使用,其實背後有更有意義。

TeleNav uses OSM

利用開放街圖為導航地圖這件事並不新鮮,開放街圖的維基上有一堆這些的服務,但能被一個在那斯達克(NASDAQ)上市的導航商所用,就別具意義,顯示出群眾外包(Crowdsourcing)的地圖己經被重視,且逐漸進入商業使用的階段。然而,群眾外包的地圖最大的疑慮是資料品質,像開放街圖在這種開放的系統,誰都可以來畫地圖,很難保證被畫上的地圖是正確的,但開放街圖並沒有太多的限制,每個帳戶是平等的,只要有一個帳號,誰都可以去畫地圖、改地圖,在沒有自動檢核機制之下,靠的是圖客們的檢視,愈多人使用,正確就會愈高,就和開放源碼一樣,符合所謂的Linus’s Law (given enough eyeballs, all bugs are shallow)。TeleNav捨棄了與TomTom合作,敢用群眾外包的圖資,顯示處理開放街圖到導航可使用的水準之成本己經不高,與其花錢去買地圖公司的圖資,倒不如把錢拿來處理開放街圖,讓自己的公司充份地掌握自己的LBS服務商品中的地圖,不用只與一家地圖公司合作,地圖圖資被一家公司所掌握。所以TeleNav在今年(2014年)1月底先以2千4百萬美元買下在德國柏林的新創公司Skobbler,其實就是想買進轉換開放街圖資料的技術,就更不用說,Steve Coast在去年(2013年)9月從Microsoft跳槽到TeleNav,早早在為使用開放街圖做準備。

地圖內容己經不是單純地是單一地圖公司提供就可以滿足現今適地性服務(LBS),Google在去年(2013年)6月也是約13億美元天價買下以色列的LBS新創公司其目的就是提供地圖與用戶互動服務,讓用戶可以透過地圖的使用能回饋到Google Map,而能讓地圖內容更符合用戶需求,當然戰略上也是為了Waze不讓Facebook或Apple給拿走,去擴增適地性服務(LBS)。 適地性服務(LBS)與社群媒體(social media)二者己經是密不可分,一方面,地圖內容如何透過社群媒體結合更多用戶來改善地圖內容、提高更新速度,另一方面,如何透過地圖使用行為,來改善適地性服務(LBS)方式,以提供更貼近人心的地理服務,無論如何,用戶才是決戰的重點,Waze號稱他們在全球有5千萬個用戶,而開放街圖呢?2014年開放街圖的全球註冊的用戶已經達160萬人,這個數量與Waze顯然有很大的差距,但二者用戶的本質是相當不同的,開放街圖註冊用戶是地圖的貢獻者,不是單純的使用者,反觀有多少人在Waze上貢獻資料呢?TeleNav當然看上這點,上那找這麼多的地圖貢獻者來繪製、編修地圖,開放街圖的社群成自然而然成為最好的後盾。

TeleNav使用開放街圖的案例,事實上就是一個開放資料成功的應用案例。就TeleNav而言,TeleNav花的錢並不是買圖資,而是技術,TeleNav所省下的成本可以用來增強導航功能,而使得他們的產品在市場上更有競爭力,另一方面,開放街圖並沒有因為TeleNav或其它廠商的使用,而更動它本來既有的運作方式,從繪製編修地圖到社群的活動都不會因為這樣而改變[註1]。一樣的道理,在談開放政府資料加值或者是產業,就是在於開放政府資料如何省去廠商資料成本,而能專注地在於技術服務的開發,這對於新創公司其實是大利多的,因為過去政府許多資料不是很貴,就是開放授權講不清,往往是有管道、有關係、大資本的公司才可以拿到資料,透過政府開放資料,免除了這樣的問題,新創公司能專注於資料使用上的創意,而不是在資料取得就己經先吃癟,怎麼能夠期待有創意,更沒辦期待像Skobbler這樣的公司出現。

因此開放街圖所開創的經濟模式,有別於以往Google Map的模式,各位可以看看,在最近5年來的競合之下,走Google Map模式的地圖商、導航商,其實只剩下Google Map了,不但國際大廠連連整併,就連Local的地圖服務商也很難掙下去,台灣有UrMap呀! 現在有多少人還用?我相信TeleNav的案例一定會帶給許多人啟發,但走開放街圖的模式是否能夠成功,這無法保證,但絕對會是另一個機會,隨著開放街圖的成熟,一定會有愈來愈多人拿來商業使用,逐漸成為有別於Google Map模式的競爭者。

[註1]有中國人前陣子頻頻大規模的修改地圖,把台灣的地名都改成簡體了,猜想和TeleNav在中國也有分公司,要在中國地圖產品,必需符合中國法律有關