以資料趨動智慧的治理

對於資料洪流的世代,資料會是智慧的重嬰來源之一,但資料到智慧並非一蹴可及,需要一個穩固的基礎來建立。今年年初的演講中整理了一些想法,基本上我認為至少會有四個概念化的基礎。

1.互動(Interaction)

是以開放資料為基礎,政府以開放資料和人民互動、協同合作,進而公私協力解決問題。

2.整合(Integration)

要能擴大合作範圍,或者使得以資料為主的協同合作順暢,資料整合的工作不容忽視,無論日本、美國、歐盟都有資料標準的語彙,來讓資料能跨領域、跨機關單位的整合,才可能創造更好的合作環境,也才有可能產生智慧。

3.智慧(Intelligence)

資料共通語彙是資料整合的一個步驟,要讓資枓整合的過程需要知識的介入規整,有助於利用資料產生智慧化服務。

4.影響(Influence)

以政府的智慧化服務而言,應該是對人民產生正面的影響,以使得人民更相信政府服務,促使公私合作更緊密。

 

DIGI+中缺少的戰略思考— 資料

DIGI+的全名為「數位國家・創新經濟發展方案」,這個方案是以「數位國家、智慧島嶼」為總政策綱領,其實就是蔡英文總統在競選時就提出的政策方向,後來上任後,由行政院科技會報完成具體內容,並在2016年11 月通過。隔了一年,今天(2017年11月29日) 才召開民間諮詢委員會,會中除了介紹DIGI+方案的內容外,並設定了二個討論提案:

  1. 政府政策如何協助推動企業的數位轉型?
  2. 政府政策如何協助建立軟硬並重的產業生態?

後來,看了一下民間諮詢委員的名單才發現有八成以上的委員都來自於業界,而且都是大公司的老闆或經理,所以會設定這樣的討論提案就不難理解,但這二個問題其實有很大的邏輯問題,DIGI+的方案都已經核定通過,政策不就寫在計畫書中了,現在才討論這二個問題豈不太晚?

先說結論,我認為DIGI+方案缺乏以資料為向度的戰略思考。

DIGI+的戰略思考是什麼?

如果仔細地唸一下DIGI+方案的計畫書,不難發現,這個方案的戰略思考是以提升世界經濟論壇(World Economic Forum)的全球資訊技術報告(Global Information Report)中「網路整備指標」(Networked Readiness Index, NRI)來決定,而台灣在近5年中,由2012年的第11名,2016年已經下滑到第19名,主要的問題有法規和稅務環境不良、人才培育不佳、政府使用ICT技術能不足、對新興技術的採購牛步、以及ICT在社會影響力低,造成排名每況愈下,事實上,以得分而言,分數的變化不大,但其它國家的進步就是我們的退步,與我們最近的國家–日本,則是從2012年的第18名,進步到2016年的第10名,而新加坡在這幾年則是始終維持在第1、2名間,因此DIGI+的目標是在2025年時,我國數位經濟規模能夠成長至新台幣6.5兆元、民眾數位生活服務使用普及率達到80%、寬頻服務可達2Gbps、保證國民25Mbps寬頻上網基本權利、我國資訊國力排名能夠躍進到前10名。還有另一說是要力拚資訊國力為全球第 6 名。

無論要爭取全球資訊國力的第幾名都好,除了眼前的問題,一個國家的數位政策是否也應該兼顧未來ICT變化與挑戰,以及現今台灣ICT體質的改善? 的確,計畫書已經把目前己經發展的資通訊技術都放進去了,但3年後、5年後呢? 這樣的計畫書內容是否能因應未來的ICT發展呢?,是否思考由最基本的地方做起,以改善體質?

資料基礎建設的戰略思考

事實上,DIGI+的計畫書中也回顧了幾個主要及鄰近國家之數位政策,但可惜的是,我們的DIGI+似乎沒有把其它國家對於ICT調適的重點摸清,以及他們的戰略思考看透。

以資訊國力進步很多的日本為例,計畫書中提到,

2013年日本IT戰略本部公布「世界最先進IT國家創造宣言」,安倍經濟學第三隻箭之一的國家IT戰略,以「活用IT,創造未來」為政策願景,「開放資料」與「巨量資料」為主要推動核心,並結合日本向來引以為傲的人工智慧技術,在物聯網環境下,透過世界最高水準的IT應用,打破困頓已久的經濟閉鎖窘境。

可見得日本的IT戰略是以資料為基底來支撐技術發展,但DIGI+的計畫書並沒有這方面深 入的洞察,以分析台灣目前環境得以借鏡的地方,只是片面且粗淺地取了日本的超高速寬頻環境的成果,來背書DIGI+的寬頻基礎建設,且回顧「美國Gigabit城市挑戰計畫」也是同樣地只是為了寬頻基礎建設,難道美國沒有其它的數位政策了嗎? 川普政府不好說,但過去歐巴馬政府時代,確實制定了許多開放政府和數位治理的策略,很多地方都值得借鏡。

回到日本的IT戰略,我相信日本NRI的排名一路走高是因為基礎建設做的好,也因為有基礎打底,許多政策不會是表面功夫,人一換就一切如過往雲煙,很多人可能不知道日本在「世界最先進IT國家創造宣言」的戰略中,有一塊是針對「資料基礎設施」的行動策略,而資料基礎設施不是在做資料平台和Open API這種表象的工作,而是制定「共通語彙基盤」和「文字情報基盤」以利資料互通,不但讓政府各單位的資訊能橫向串聯,而且中央與地方政府的資訊也能縱向串通,在這個基礎上,針對「AI農業」(Agriculture Informatics)的進展,再制定「農業共通語彙」先讓農業資訊標準化,以利農業資訊共通,達到資訊利用最大化,創造以資料活用的經濟效益。

日本人瘋了嗎? IT最先進國的宣言居然在做這麼基礎的工作?! 但各位可以想一想,有多少人在FB或PTT上在靠北政府資料品質不好,連「台」和「臺」都不統一、連UTF8和BIG5也弄不清楚,更別說幾年前一個會議講「資料開放」,可能各自心中都有一個定義,且不太一樣。無論是AI、或是巨量資料,機器可理解愈多,人要處理的就愈少,我們要讓機器做的愈多,資訊愈標準化愈有可能,日本的IT戰略會有這樣的行動方案,一定是遇到很多資料無法整合問題,而造成資料應用和分析上的成本。

反觀台灣,我們沒有這類的問題嗎? 我們的開放資料走的快,得了個第一名,卻有了面子,忘了看裡子,開放了這麼資料,我們卻常被資料品質所苦 ; 有了這麼多資料,卻沒有可以拿出去國際上一較高下的應用案例 ; 政府釋出資料,卻不知道意義是什麼? 忘了開放資料所帶來可能的橫向和縱向串聯,而DIGI+中卻看不到日本IT的戰略思維,把開放資料視為敝屣,看不到資料基礎建設的價值。

科技始於來自於人性、智慧就是來自於資料

DIKW金字塔說明了如何從資料中得到資訊、轉化知識、運用知識成為智慧,因此當一個數位政策冠上智慧XX、如智慧島嶼、智慧城鄉、智慧生活應用、智慧製造服務、…的同時,不禁要問,這智慧從何而來?

會議中有委員提到「政府應推動各產業打造數據中心,以利用數據來提供智慧化服務」,這讓我想到去年在歐洲資料論壇聽到的計畫,Industrial Data Space,是一個藉由資料的數位治理(Digital sovereignty),也是一個由資料為基底來提供智慧化服務的計畫,這個計畫認為在工業的數位轉型中很重要的一個項目是在於資料和服務在公司間交換,藉由資料交換,以及與開放資料的整合來串聯公司,可以在新產品和智慧服務中產生附加價值,也就是說這樣新的數位商業模式是有機會應用在傳統工業的公司上。

Industry Data Space就是一個執行工業4.0的計畫,並大量使用資料治理的方法來達到以資料為底蘊的智慧化服務和產品,其中有一個重要的部份是在於一個「參照架構模型」(Reference Architecture Model),其實這就是前面提到的資料基礎設施的一環,如果各位有空去看看內容會發現,這之中有語彙、又有鏈結資料(Linked Data),所以是不是各位可以更理解,為日本在喊IT最先進國宣言,花了功夫在共通語彙基盤上呢?

資料趨動的轉型是數位治理的基礎

以資料趨動的轉型是一個硬功夫,確實要花很多心血和頭腦,但綜觀許多國際案例,資料基礎設施是一個資料趨動轉型的重要支柱,是數位治理的依據。我們的ICT環境比日本先進嗎? 為什麼我們要忽略這一塊? 有德國Industrial Data Space的案例,做為數位政策的 DIGI+ 有意識到資料在產業轉型的重要性? 會議中有另一位委員提到一段令人贊同的話,「在談產業的數位轉型之前,政府可否先做到數位轉型成功後,再來輔導產業」,所以目前DIGI+的計畫書內容真的有辦法帶給台灣政府數位轉型,以帶動產業嗎? 我存疑。台灣的資訊國力會因為這個DIGI+的計畫推動而提昇嗎? 我也存疑。

 

資料轉成RDF就是4星級資料了嗎?

因產銷履歷農產品鏈結資料之計畫所需,在data.gov.tw上尋找食品業者登錄資料集,意外的發現這筆資料居然提供RDF格式,不但如此,衛福部食藥署還有一個LOD的網頁,集合了他們製作的RDF資料集。引起了我的好奇,去看看這些RDF的資料,若他們的資料與系統完備,我們的產銷履歷農產品RDF資料即可以和衛福部食藥署的RDF資料連結,但看完資料後覺得有些建議,提出來和大家分享。

<rdf:Description rdf:about="http://data.fda.gov.tw/lod/tfda/FoodCompanyRegistration_VIEW/DATA_SN/6833319">
   <rdf:type rdf:resource="http://data.fda.gov.tw/lod/schemas/tfda/FoodCompanyRegistration_VIEW"/>
   <tfda:公司或商業登記名稱>早安!美芝城仁愛店</tfda:公司或商業登記名稱>
   <tfda:食品業者登錄字號>E-200028714-00002-7</tfda:食品業者登錄字號>
   <tfda:登錄項目>販售場所</tfda:登錄項目>
   <tfda:公司統一編號/>
   <tfda:業者地址>高雄市新興區仁愛一街177號</tfda:業者地址>
</rdf:Description>

上述是食品業者登錄資料集中的一筆資料,沒有了URL,其它的格式的資料沒有什麼不一樣。URL所指涉的是一件事物,讓別人可以去連結這份資料,而在食品業者登錄資料集中,主體是「食品公司」,所以<http://data.fda.gov.tw/lod/tfda/FoodCompanyRegistration_VIEW/DATA_SN/6833319> 指的是一個「食品公司」,即是「早安!美芝城仁愛店」,可被連結的。「早安!美芝城仁愛店」是一個實例(instance),而「食品公司」則是類別(class),因此rdf:type中應該指的是「食品公司」,就是<http://data.fda.gov.tw/lod/schemas/tfda/FoodCompanyRegistration_VIEW>。

1. URL 設計不良

邏輯上,這個RDF 的表達沒有錯,但就URL的設計而言,實在很糟禚。為什麼不簡單清楚一些? 例如,類別的名稱簡單清楚,用FoodCompany取代FoodCompanyRegistration_VIEW,因此,<http://data.fda.gov.tw/ontology/FoodCompany>來指食品公司的類別(class),而<http://data.fda.gov.tw/ontology/FoodCompany/6833319>來指「早安!美芝城仁愛店」這家店。

其實URL的設計是有一些原則,其詳情可以參考W3C的文件 Cool URIs for the Semantic Web

2. RDF與知識本體應一致

再者,這份RDF中的標籤使用中文,但知識本體的宣告卻是英文,這樣的做法機器是沒辦法知道RDF內用中文宣告的屬性,在知識本體中是對到那一個英文。或是說URL根本就不一樣,怎麼有可能對在一起!

3.提供SPARQL查詢

RDF資料通常會利用三元組儲存庫(triple stores)來管理、儲存和查詢資料,這些三元組儲存庫通常也可以透過網路提供SPARQL的查詢服務,因此常稱為SPARQL endpoints,這些工具的技術都己經成熟,而且也有自由軟體可以利用,同時因開放碼源,也可以客製化成自己需求的服務,如果使用者還是把資料下載再使用,那用URL去指稱事物的功能,在網路上就無法發揮更好的效用。

4.缺乏利用既有語彙

為了資料容易整合,在建立資料知識本體時,多考慮使用標準或既有的語彙為主,以增加資料的可再使用性。食藥署的這批RDF資料,無論在類別或屬性都有標準或既有的語彙,是可以考慮多使用這些語彙。

開放與機密!? 一個「鳥」看法

因為601旅所在的龍潭機場並非要塞堡壘地帶,15人的貴婦觀光團不被起訴,但同樣地,鈕承澤拍攝電影,因勘景需求,「申請」進入高雄軍港,而中國籍攝影師因未在名單之內,卻因鈕承澤為演藝知名人士,海軍接待人員不疑有他,讓中國籍攝影師混在這行勘查團中,進入高雄軍港,結果因違反「要塞堡壘地帶法」第10條第1項之非法出入罪,處有期徒刑5月,緩刑2年,並應向公庫支付新臺幣60萬元,加上60小時之義務勞務。這之間差別在於被造訪的地方是否被劃為要塞堡壘地帶,但有多少地方被劃為「要塞堡壘地帶」呢? 這個問題只能問國防部,根據蕃新聞中有一文章寫到

根據檢調掌握的資料,目前涉及「要塞堡壘地帶法」中範圍包括本島基隆、新北、新竹、花蓮、台東、高雄6處,其餘則為外島的金馬、澎湖等地。
由於「要塞堡壘地帶法」的認定範圍,不能全然由檢方認定,因此必須要函詢國防部等相關單位確認。

而吊詭的是,在阿帕契案爆發時,601旅所在的龍潭機場是否為要塞堡壘地帶法所認定之範圍,就有網友打臉國防部,在行政院公告「龍潭、新社、頭嵙山、歸仁及左營等5處軍用機場周圍禁止飼養飛鴿距離範圍」之中,即是依照要塞堡壘地帶法來禁止機場周遭的養鴿,但最後法院無法起訴這15人是因為國防部根本沒把龍潭機場劃定為要塞堡壘地帶,那之前的公告是怎麼回事?

國防部對於要塞堡壘地帶法所劃定的區域是否應該讓國人充份了解,以免沒事去釣魚也可能觸闖要塞堡壘地帶在民用機場拍照也可能被抓也不能隨便拍軍機 … ,軍方只要不讓你看、不讓你知道,就用一個過時的法令來恐嚇人民,遇到權貴之時,這些法令反而成為保護傘,不免讓人質疑,這塊國防布果然是遮腐蓋爛、而不防機密,國防部很鳥、塞堡壘地帶法也很鳥。

而真正「鳥」的觀點是,是從空中看來這些存放國軍精良武器的軍事基地,以當代民用衛星航空的科技,要把軍事基地看的一清二楚根本不是什麼難事,故意把地圖留白,就可以隱藏基地嗎? G社所提供的衛星影像中,龍潭基地清楚可見,但在農林航測所提供的航空相片圖,則是挖空了一塊,再來看看OSM和G社的在龍潭基地附近的地圖,G社地圖以前是台灣民間製圖商提供,對於軍事用地依照OSM把基地範圍、跑道、和建物都揭露了,在阿帕契案前,對於軍事設施的製圖,都盡量不主動提起,避免麻煩上身,但阿帕契都是農村設施了,有什麼好忌諱的,我們只是畫畫軍事基地的農村設施罷了!

再者,臺灣地區基本圖測製管理規則 在2003年就己經廢止,現行法令國防部是什麼法令限制軍事用地的繪製呢? 國家安全法? 國家機密保護法? 但貴婦組團就能進入了,還有機密可言? 國土安全也只不是FB照片讓人按讚的理由。

Screenshot 2015-08-23 11.08.17TG-96224060-4
Screenshot 2015-08-23 11.16.23

資料開放是不能涉及國防安全,這個道理誰都能懂,在談地理空間資料的開放時,往往遇到要問國防部,事情恐怕就是GG。但對於什麼是國防機密的認定,感謝貴婦團一行人突破重圍,讓我們了解,很多本來被認為有危及國家安全的規定,其實國防部並沒有這麼要求,但行政機關還在以舊有法令來威嚇人民!?

那什麼樣的地理空間資訊開放會危害國家安全? 什麼是資料是機密? 國防部有能力判斷嗎? 阿帕契儀表板未通電下,拍照po網是否構成洩密,國防部自已也不確定,還得老美說沒問題,才由法院判定不起訴。同樣的道理,以當代資訊科技發達,國防部是否能掌握新興科技的發展,而有防治策略呢? 話說,2公尺解析度的數值高程模型(DTM)是機密資料,而5公尺解析度的數值高程模型(DEM)則是一般公務機密,精細的地表高程資料,可以提供彈道計算,提高飛彈命中目標機率,然而這個理由成立嗎? 花點錢,在日本或國外的一些公司行號,就可以買到5公尺等級的數值高程模型(DTM),再者,對岸的中共,衛星技術並不差,這些資料共軍無法自己生產嗎? 那國防部管制的理由是什麼呢?  還是一切以跳針式的回應,「不可以!、不可以!、不可以!」,問為什麼不可以,回答依然是「就是不可以!」 ,這種愚民式策略,在當代開放政府的風潮下,這種處理方式,只會突顯自身能力的崩壞。鳥!

 

一個智慧‧各自表述

行政院正推動「網路智慧新臺灣政策白皮書」,日前參加了智慧國土分組第二階段實體會議,才了解整個想法根本就是舊酒裝新瓶,一堆過去的報告書的重組,看到一堆令人匪疑所思的問題。

如果核心議題在於如何從網路新型態互動過程過中得到智慧,使政府治理更有效能,那為什麼智慧國土的核心是永續國土? 既使是永續國土好了,那如何透過網路互動模式使國土永續呢? 這個根本性的問題影響了整個智慧國土構面的架構與論述。因為接下來的三個推動項目是「智慧防災」、「智慧運輸」、和「智慧城鄉」,根本就是「一個智慧,各自表述」,看起來就像三個推動項目中所涉及的各政府部會,將熟悉的職掌業務中,湊出來的一份白皮書,集合了一堆和網路有關係的關鍵字,如IOT、雲端、和群眾外包…等等, 但空泛的文字,整份報告書看不出來要解決問題是以什麼為本?

舉個例子來說,在智慧防災中提到「利用網路與通訊科技,結合政府與民間力量,來提高防災、抗災與救災的能力」,在這個白皮書的脈絡中指的「民間」應該是誰? 不再是過去所認知的民間了吧!? 既然是網路智慧新臺灣政策白皮書,這個「民間」就應該包含網路社群,甚至是以網路社群為主體,那問題就來了,結合政府與民間(網路社群)絕對不會是單純的只有網路與通訊科技,難道政府發給民間(網路社群)每人一支4G 手機,且保証4G覆蓋無死角,還是衛星電話,大家發生災害時可以馬上打電話呢?

民間和政府的協同合作的基礎是在於開放與透明,也就是構成開放政府的要件,加拿大政府更是以開放指令和授權為基礎,來達到開放資料、開放對話、和開放資訊,藉由這三個管道,使得資料可取得、公民可以參與、新技術可以介入、且專業可以完整。回過頭來,如何透過開放、透明的基礎,公民參與政府公共事務, 協助政府解決問題的同時,也增加政府治理效能,使民眾得到更多便利或得到更好的生命財產保障,才是防災、運輸和城鄉具有智慧的基礎,不是嗎? 再者,內容也提到「運用物聯網科技,提升對災害應變的能量即時訊息的快速傳遞」。其實談IOT,或是Sensor web,還是無法摒除開放,若資料不是開放的,沒有結構化,如何架構出機器對機器相互交換資料的環境? 所以撰寫白皮書的人到底了不了解IOT,或是Sensor web呀~~~~~~

其實我一直很不解,無論防災、運輸、或城鄉都大量使用地理資料,也都應當以國土地資訊,或是說時空地理圖資雲為基礎,而且NGIS2020計畫也即將完成,但這二個部份和智慧國士中三個推動項目的關係是如何? 如何把地理資料充份整合,以支援三個推動項目? NGIS2020對於眾群協同合作也都有規劃,那這部份和三個推動項目所要進行的事的關係為何? 如何相互支援? 這難免讓我想到,內政部資訊中心和國發會國土處有什麼問題嗎? XD

開放資料推廣的雜想

什麼是開放資料的推廣? 要怎麼推廣開放資料?應該還有更多可以做的事吧!

1. 除了hackathon,應該還有不一樣的thon,如 ideathon, mapathon, editathon….。

2. 除了APP競賽,更應該強調開放資料混搭的創新。

3. 除了APP競賽的成果,需要更多的開放資料成功案例。

4. 除了政府開放資料,個人、非營利組織(民間社團)、到企業都可以開放資料,從上到下、或從下到上,整合資訊的過程即是推廣。

5. 除了開放資料,如何使用開放源碼處理開放資料更有吸引力。

6. 除了政府補助的開放資料課程,應該還有大學校園的課程、線上課程、工作坊…..等。

7. 除了民間的課程,政府也應該讓公務人員上更多的課程。

8. 除了專業的內容,應該思考如何將有些開放資料遊戲化(gamification)。

2013-05-04 Open Data Meetup 一些心得 — 開放資料的目的是在於透明化

感謝Whisky號召讓大家在週末前來個Meetup,也感謝David提供場地準備點心零食。網路上的召集,昨天晚上聚集了來自各界的17個人的參與,MnO2快筆寫下這個meetup記錄,在這裡來分享一下個人的一些心得。

因應政府資料開放平台( data.gov.tw) 公測版的上線,這個meetup想讓大家聚在一起討論這個平台的問題,和未來對政府開放資料的期許。研考會似乎想知道和民眾期待的落差有多少? 但來這裡接收這些訊息的人是來自於凌網科技?我的困惑是凌網科技與研考會的關係為什麼要搞的如此的如膠似漆?可以做這個平台的廠商或NGO組織應該不少,凌網應該不是唯一吧!?但這個平台下一期仍然會由凌網得標? 有沒有人可以揭露一下為什麼凌網科技是研考會的唯一? 研考會為什麼選凌網科技來承包開放資料的平台的業務?廠商有什麼能力與資格才能承包這種業務?是不是很多人和我一樣想知道? 因為無「知」,請原諒我在談論中一直吐糟這位來自於凌網科技的朋友。

聚會中有不少人不認為在meetup中各自提出「政府應開放的10種資料」,政府的就會如實開放?我的反應很直接,以地籍資料而言,目前就是一個不可能的任務,因為這個資料是地方政府財源之一,對於開放的反對聲音會很大,內政部國土測繪中心若想開放還得有一段很長溝通過程。而許多與公部門交手過的與會者也多少了解基層的資料業務單位面對開放資料問題和困惑,若他們想談,許多資料使用者也願意溝通,而不只是一昧批判,因此重點在於能不能建立這樣的溝通機制?如英國政府資料開放平台(data.gov.uk)有data request 的功能,使用者若找不到可以利用data request來要資料,這個需求會被送到資料的業務單位,資料是否開放的處理過程和溝通皆公佈在平台上,其他對於這個資料有興趣的人就也可以知道處理清況,事實上,CfThellodata也在蒐集這樣的經驗。若這個資料的開放真的對於社會公益有幫助,在這樣公開的討論下,資料業務單位也會面臨極大的民眾輿論的壓力,回到地籍資料,若多數人覺得這是一件極需要開放的資料,如在Facebook上,大家都來按「讚」,地方政府也會感受壓力,我們的代議士們也才會感受「民氣」(選票),進而觀切,好啦,這個太理想了!?

開放資料社群也意識到這點,在做自已的「平台」表達開放資料的期許,展示對開放資料的處理能力,如零時政府的data.g0v.tw、經由網絡行動科技(Netivism)中譯且調校的CKAN,在青平台架起的台灣資料開放平台、 Cft再整理台北市政府的開放資料放在github上,從這裡長官們不難發現社群要的是什麼樣的平台和資料吧?!

總之,開放資料的目的是在於透明化,也就是人民有「知」的權利,無論平台,還是request的機制,都得在一個透明化過程進行。個人相當期盼有一個建全的開放資料平台,且該平台有資料request 的機制,提供民眾請求資料開放,且處理過程能透明化公開,再一次,好啦,這個太理想了!?

快篩「政府資料開放平台(公開測試版)」

一個開放資料平台是施政者用來證明政府開放程度的最佳方法之一,政府開放資料平台的成立是為了邁向透明化政府,讓人民看得到,而且「有感」! 因此透過人民使用政府所開放的資料,一方面,人民可了解政府施政、參與政府政策、甚至提出建言,使政府更有效率;另一方面,人民亦可利用政府所開放的資料,經由自己的創意與加值,從這之中獲利,政府即透過資料的開放而創造就業機會增加民間產值。

順應世界Open Data 潮流,研考會終於成立了「政府資料開放平台」(data.gov.tw),讓台灣達到Open Data的一個里程碑,恭禧! 但快速地瀏覽這個平台後,有「感」!感受到台灣政府對於透明化政府的害怕、抗拒與掙扎:

  • 過度本位主義的「政府資料開放平臺資料使用規範」。使用規範,或者說是該平台上的資料授權,主要是用來確保資料使用者在散佈、重製和改作該平台上資料時,不受智財權的限制;另一方面,政府釋出資料,恐怕因為有人用了這些開放資料後,造成財產或權益上受損,因此都會有免責聲明,這些都可以理解,但在使用規範中,聲明各機關可以停止提供資料,是一件值得商榷之事。政策改變而導致資料提供不符公共利益?我還想不出來有什麼樣的例子會有這樣的情況發生。而資料開放前,各機關就得清查所開放的資料是否涉及他人智財權、隱私和國防安全考量,怎麼會在開放後,因查覺到這些問題,才說不開放?這是為各機關不願意在開放前清查資料脫責?

六、開放資料停止提供 

有下列情形之一者,各機關得隨時停止全部或一部開放資料提供,使用者不得向本平臺管理機關及各機關請求任何賠償或補償:

(一) 因政策變更或其他正當事由,致各機關認為繼續提供資料供使用者加值使用,已不符合公共利益之要求者。

(二) 各機關開放之資料有侵害第三人智慧財產權、隱私權或其他法令疑慮

  • 重複開放、授權不一。「產銷履歷」為農委會項下的開放資料,是以CC 3.0-BY-SA方式釋出,但研考會把它再收入一次,但研考會的授權規範可以淩駕於CC授權?根據上述第6條,若政府因某些原因要停止開放產銷履歷,但早以CC釋出的資料是不能這樣被停止。
  • 人民不笨! 資料筆數多寡不會是用來評估平台的好壞的唯一指標,令人有感的資料才是符合人民期盼。當我看到「鐵路時刻表」和「客運時刻」時,著實地讓我倒抽一口氣,讓我驚訝政府透明的態度,時刻表還要開放嗎?本來就應該是開放的資料,難道在資料沒放上此平台前,交通部不允許火車時刻表被使用? 這只是多提供一個資料接口罷了!當然就不用說,資料提供只是為符合上級要求的各單位5項,因為教育部把大學、中學、小學、幼稚園的住址拆開,就有好幾個表,夠交差了!這樣的情形在台北市開放資料平台也有,OK認證也用產業別被拆成好幾個表,等著看吧!這種情形應該會不斷發生。
  • 沒有資料視覺化功能,當然就不可以有分析功能。目前Open Knowledge Foundation所建議的資料開放平台(CKAN),在資料上傳至平台後,可以將表格化的資料利用open source 的JavaScripts,將資料呈現,好驚訝!一個國家級的資料平台,是以這麼raw的資料呈現。
  • 資料編碼.地理座標格式不統一,增加使用者困擾。BIG 5 –> UTF8, TWD97TM2 –> WGS84 Lon/Lat