交通部開放資料之成果斐然,各界有目共睹。其中「公共運輸整合資訊流通服務平臺」(Public Transport Data eXchange,PTX) 以國際資料標準建立互通平台,並以API方式流通交通資料,實為各界佳話。既然交通部可為國內開放資料範模生,何不依此基礎更上一層樓,將資料品質和服務皆提升,讓開放資料進入四星、甚至是五星等級,因此有幾個建議提供交通部在開放資料推動上參考。
會議中有委員提到「政府應推動各產業打造數據中心,以利用數據來提供智慧化服務」,這讓我想到去年在歐洲資料論壇聽到的計畫,Industrial Data Space,是一個藉由資料的數位治理(Digital sovereignty),也是一個由資料為基底來提供智慧化服務的計畫,這個計畫認為在工業的數位轉型中很重要的一個項目是在於資料和服務在公司間交換,藉由資料交換,以及與開放資料的整合來串聯公司,可以在新產品和智慧服務中產生附加價值,也就是說這樣新的數位商業模式是有機會應用在傳統工業的公司上。
Industry Data Space就是一個執行工業4.0的計畫,並大量使用資料治理的方法來達到以資料為底蘊的智慧化服務和產品,其中有一個重要的部份是在於一個「參照架構模型」(Reference Architecture Model),其實這就是前面提到的資料基礎設施的一環,如果各位有空去看看內容會發現,這之中有語彙、又有鏈結資料(Linked Data),所以是不是各位可以更理解,為日本在喊IT最先進國宣言,花了功夫在共通語彙基盤上呢?
資料趨動的轉型是數位治理的基礎
以資料趨動的轉型是一個硬功夫,確實要花很多心血和頭腦,但綜觀許多國際案例,資料基礎設施是一個資料趨動轉型的重要支柱,是數位治理的依據。我們的ICT環境比日本先進嗎? 為什麼我們要忽略這一塊? 有德國Industrial Data Space的案例,做為數位政策的 DIGI+ 有意識到資料在產業轉型的重要性? 會議中有另一位委員提到一段令人贊同的話,「在談產業的數位轉型之前,政府可否先做到數位轉型成功後,再來輔導產業」,所以目前DIGI+的計畫書內容真的有辦法帶給台灣政府數位轉型,以帶動產業嗎? 我存疑。台灣的資訊國力會因為這個DIGI+的計畫推動而提昇嗎? 我也存疑。
LOD in Agriculture Workshop 做為G20 農業首席科學家會議(MACS)之一,聚集農業科技上的科學共同討論農業資料之標準化、結構化、鏈結化、及應用上的問題,這個會議是由GODAN ( Global Open Data for Agriculture & Nutrition)、 德國農業部(BMEL)、和德國農業科技與建立協會(KTBL)等三個單位來共同舉辦。
會議開場是由德國農業科技與建立協會(KTBL)的 Daniel Martini 主持。首先,由德國農業部(BMEL)官員致詞,說明會議舉辦的背景,是由於德國今年於漢堡(Hamburg)舉辦G20會議,並因此在波茲坦(Potsdam)舉辦G20中首席農業科學家會議(MACS),而去年的G20會議在中國時,就強調資通訊科技在農業上的應用與發展,延續這個議題,有鑑於歐盟近5年來在鏈結資料上的發展,德國今年則嘗試以鏈結資料在農業上的討論為主來承續中國在去年開啟的議題。而他也說明,雖然這是G20的會議之一,但這個會議其實不侷限於G20的成員參與,而是著重於農業和食物科學議題討論,而開放資料的策略提供更多在農業議題脈絡中創新的機會,有助於解決當前全球共同面對的農業和食物問題。
如何透過開放資料建立更好的農業和糧食資料的利用,進而解決問題,是GODAN計畫在尋找的解決方案,全球各地許多科研單位和科學家加入。他也強調,在剛結束不久的科研資料聯盟(Research Data Alliance, RDA)第10次會議於加拿大蒙特婁(Montréal)舉辦,其中有許多議題都和鏈結資料有關,而鏈結資料的技術與方法在農業和糧食問題的研究發展方興未艾,本次的會議就是想更深入去探討農業上的鏈結資料。
會議主辦方邀請Elsevier的Paul Groth博士,以 「The Roots: Linked Data and the Foundations of successful agriculture data」為題進行專題演講。Groth博士先自我揭露說,他的科學背景是電腦科學,著重於開放資料和鏈結資料,而非農業領域,但家鄉是荷蘭,是非常重視農業科技的國家,也算是和農業扯上邊。
他先以三個問題來揭開專題演講,這些問題也是整演講的脈絡。
鏈結開放資料如何能讓農業不同以往? (How can Linked Open Data make a difference in agriculture? )
什麼樣的技術門檻阻礙了這個發展? (What technical obstacles stand in the way?)
什麼樣的政策需要配合? (What policies are needed to achieve the potential?)
而研究科學資料在很早以前就開始討論資料開始的議題,在國際科學理事會(ICSU)帶領下,國際科學與技術資料委員會(CODATA)及研究資料聯盟(RDA)的會議中不斷地探討科學資料開放的議題,也使得投入科學資料開放的研究者愈來愈多,Groth博士以他為共同作者的Scientific Data期刊文章「The FAIR Guiding Principles for scientific data management and stewardship」為例,引導了科學資料中倡議開放資料的FAIR 原則,即是Findable, Accessible, Interoperable, 和Reusable,其節細內容如圖2,而達到FAIR原則所導向是成功的資料,而達成成功資料的最佳途徑就是鏈結資料。
圖2: FAIR原則 (來源: Wilkinson et al., M.D. 2016, The FAIR Guiding Principles for scientific data management and stewardship, Scientific Data 3, 160018)
The paradigm shift of the ImageNet thinking is that while a lot of people are paying attention to models, let’s pay attention to data. … Data will redefine how we think about models.
Groth博士進一步地以FAIR Data的概念來說明資料供應的標準和語彙如何強化資料的品質,在多資料來源和多使用者的平台上更加顯得重要,他就以全球變遷資料庫「The Global Change Information System」來說明如何利用W3C PROV (Provenance Vocabulary) 來幫助平台的資料品質。