快篩「政府資料開放平台(公開測試版)」

一個開放資料平台是施政者用來證明政府開放程度的最佳方法之一,政府開放資料平台的成立是為了邁向透明化政府,讓人民看得到,而且「有感」! 因此透過人民使用政府所開放的資料,一方面,人民可了解政府施政、參與政府政策、甚至提出建言,使政府更有效率;另一方面,人民亦可利用政府所開放的資料,經由自己的創意與加值,從這之中獲利,政府即透過資料的開放而創造就業機會增加民間產值。

順應世界Open Data 潮流,研考會終於成立了「政府資料開放平台」(data.gov.tw),讓台灣達到Open Data的一個里程碑,恭禧! 但快速地瀏覽這個平台後,有「感」!感受到台灣政府對於透明化政府的害怕、抗拒與掙扎:

  • 過度本位主義的「政府資料開放平臺資料使用規範」。使用規範,或者說是該平台上的資料授權,主要是用來確保資料使用者在散佈、重製和改作該平台上資料時,不受智財權的限制;另一方面,政府釋出資料,恐怕因為有人用了這些開放資料後,造成財產或權益上受損,因此都會有免責聲明,這些都可以理解,但在使用規範中,聲明各機關可以停止提供資料,是一件值得商榷之事。政策改變而導致資料提供不符公共利益?我還想不出來有什麼樣的例子會有這樣的情況發生。而資料開放前,各機關就得清查所開放的資料是否涉及他人智財權、隱私和國防安全考量,怎麼會在開放後,因查覺到這些問題,才說不開放?這是為各機關不願意在開放前清查資料脫責?

六、開放資料停止提供 

有下列情形之一者,各機關得隨時停止全部或一部開放資料提供,使用者不得向本平臺管理機關及各機關請求任何賠償或補償:

(一) 因政策變更或其他正當事由,致各機關認為繼續提供資料供使用者加值使用,已不符合公共利益之要求者。

(二) 各機關開放之資料有侵害第三人智慧財產權、隱私權或其他法令疑慮

  • 重複開放、授權不一。「產銷履歷」為農委會項下的開放資料,是以CC 3.0-BY-SA方式釋出,但研考會把它再收入一次,但研考會的授權規範可以淩駕於CC授權?根據上述第6條,若政府因某些原因要停止開放產銷履歷,但早以CC釋出的資料是不能這樣被停止。
  • 人民不笨! 資料筆數多寡不會是用來評估平台的好壞的唯一指標,令人有感的資料才是符合人民期盼。當我看到「鐵路時刻表」和「客運時刻」時,著實地讓我倒抽一口氣,讓我驚訝政府透明的態度,時刻表還要開放嗎?本來就應該是開放的資料,難道在資料沒放上此平台前,交通部不允許火車時刻表被使用? 這只是多提供一個資料接口罷了!當然就不用說,資料提供只是為符合上級要求的各單位5項,因為教育部把大學、中學、小學、幼稚園的住址拆開,就有好幾個表,夠交差了!這樣的情形在台北市開放資料平台也有,OK認證也用產業別被拆成好幾個表,等著看吧!這種情形應該會不斷發生。
  • 沒有資料視覺化功能,當然就不可以有分析功能。目前Open Knowledge Foundation所建議的資料開放平台(CKAN),在資料上傳至平台後,可以將表格化的資料利用open source 的JavaScripts,將資料呈現,好驚訝!一個國家級的資料平台,是以這麼raw的資料呈現。
  • 資料編碼.地理座標格式不統一,增加使用者困擾。BIG 5 –> UTF8, TWD97TM2 –> WGS84 Lon/Lat

 

6 thoughts on “快篩「政府資料開放平台(公開測試版)」”

  1. 您好:

    我最近正在搜集Open Data資訊,關於您提到的這一段”沒有資料視覺化功能,當然就不可以有分析功能。”有點問題想請教一下,以我目前所找到的訊息,政府單位在Open Data內最重要的工作就是將原始數據呈現。
    因此您所說的以表格將RAW呈現,並無與Open Data的精神相背呀,所以想請教您是否我理解錯誤您這一段所說的意思了。

    謝謝

  2. 我可能沒有表達的很清楚。我並不是指開放Raw Data不對,而是指資料呈現方式過於底階(low),這個問題和收集資料的時候,對於格式的要求有關,雖然開放資料過程中並不特別要求資料格式,只要賦與開放授權就可以是開放資料,也就是所謂一顆星等級的開放資料,所以資料格式可以是PDF、掃瞄的文件、或是一些非結構化檔案,但這樣的資料不利於資料的再利用,然而,一個國家級的開放資料平台而言,應該要很少看到一顆星等級的開放資料才是,至少是以CSV檔的資料為主,使得資料容易再利用,而開放資料平台也可以直接讀取,而做一些資料呈現,如簡單的統計圖表,地理資料則可以直接顯示在地圖。所以所謂的太raw,有點一語雙關,是因為資料格式過於非結構化,很raw,所以資料呈現也很low,或許寫得很快,沒有仔細思考,若造成誤會多多原諒。

  3. 您好:
    但是我看data.gov.tw時似乎沒見到PDF這些非結構化的檔案,多數為CSV、TXT、JSON、XML等,可直接利用的檔案,我想這些應該都已經是超過一顆星等級的資料囉。美國還有一堆PDF檔呢…

  4. 謝謝指正! 但在275筆資料中雖然沒有了PDF,但仍有PNG檔。另外,我想重點是在於data.gov.tw這個平台資料呈現的能力,即使有這麼多資料是以結構化的格式釋出,那為什麼不能提供簡單的資料視覺化呈現呢?

  5. 確實,我同意您說的可以加入地理資訊系統,不過統計的部份~我想如果仍交給政府單位去做,最後又會退回”公開資訊”。反而喪失原有”開放”Raw Data的標的了。XD

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.