Valeria Pesce, Semantic challenges in sharing dataset metadata and creating federated catalogs: the example of the CIARD RING
Valeria Pesce 是全球農業研究論壇(GFAR)的資訊系統經理和計畫經理,且與GODAN的祕書共同合作,過去曾代表FAO和GFAR,現今則是加入歐盟計畫資料基礎計畫( agINFRA, Big Data Europe),並管理CIARD RING和AgriProfiles開放資料平台的在全球與區域間的協調工作。
Pesce 也說明了選擇農業領域和跨領域語彙用於CIARD RING平台經驗,CIARD RING是一個農糧資料集和資料服務的聯合目錄平台,RING是指Routemap to Information Nodes and Gateways,為GFAR對於農業研究發展(Coherence Information for Agriculture Research for Development, CIARD)的計畫,RING的主要目錄可以提供資料和資料集,且都有詮釋資料,並使用RDF編碼。聯合目錄是透過獲取(Harvest)其它目錄平台的詮釋資料而來,目前有聯合的平台計有datahub, EU open data portal, Dataverse catalog, data.gov.uk, data,gov等,計有2740筆資料,4832項服務。RING平台的詮釋資料是以DCAT-AP、VOID和DataCube為主,並且會推出RING DCAT profile,她隨後介紹了RING平台中對於資料和資料集的詮釋資料編碼。
Holger Lilienthal, The Research Center for Agricultural Remote Sensing (FLF) – a data source for agricultural information based on Sentinel satellite data
Silke Migdall, ESA’s Food Security Thematic Exploitation Platform “Supporting sustainable food production from space”
Bernd Hoffmann, Decision support for crop protection – Pest identification using UAV technology
Sebastian Fritsch, Using open data and artificial intelligence to digitize global agriculture
Uwe Voges, Linking and finding earth observation data on the Web
Jerzy Weres, Programming technologies supporting management of Linked Open Data in the domain of cereal grain drying and storage
Jerzy Weres教授是來自波蘭波茲納(Poznan)大學農業及生物技術學院資訊應用系。他認為農業資訊對於農夫或農業工程而言都是重要的基礎,這些資訊有助於做出更好的決策,而要讓決策支援的軟體能與時並進,就必須去使用未來的網路科技,這樣的科技己經可以被用來增加決策支援系統的功能性、可靠性、使用性、可維持性和效能,藉由語意網技術來整合多種不同資訊來源現在已經是未來系統發展的趨勢,語意網技術為基礎的系統的新見解是如何透過整合軟體而讓傳統平台開放和利用智慧型手機的開放近用。
Daniel M. Herzig, Searching Linked Data Graphs with GraphScope
Herzig博士之前是德國卡爾斯魯爾科技研究院(Karlsruhe Institute of Technology, KIT)之應用資訊和正規描述方法研究所(Institute of Applied Informatics and Formal Description Methods, AIFB) 之成員,該研究所亦是歐洲語意網研究的重點研究機構,出產許多知名的語意網研究學者。Herzig博士於2014年共同創辦了SearchHaus,這家公司致力於利用圖管理(graph management)方式於巨量資料的關鍵字查詢,metaphacts則是另一家於2014年成立的公司,致力於知識圖管理的公司,2017年二家公司併整,Herzig博士成為這家公司的營運長,該公司目前約10人左右。
Daniel Martini, Linked Data architecture components – How to attach linked data services to legacy infrastructure?
Daniel Martini是籌辦單位之一德國農業科技與建立協會(KTBL)中資料庫和知識技術組的專家,他們團隊在2004年左右就開始進行AgroXML的建立與發展。在他的演講中一開始先說明了KTBL這個單位的背景,KTBL是一個有註冊的非營利協會,2/3是由德國農業部所資助,有來自於學術、業界的各領域專家約400位成員左右所組成,有70位左右的職員在Darmstadt工作,管理許多工作小組、組織專家工作坊、出席相關委員會、以及維持專家網絡。KTBL的任務是將研究成知識導入農業的實務中,並以專業來支援政策決策,評估新農業技術在經濟和生態在衝擊,以及提供計畫性資料(如,投資、產品處理過程…)到農夫。資訊技術的角色有三: 一為資料獲取,是由開放資料來源中獲得,二為資料處理,是由原始資料轉換為計畫資料,三為資訊提供,透過電子書、網頁和APPS,傳遞農業資訊給客戶。
LOD in Agriculture Workshop 做為G20 農業首席科學家會議(MACS)之一,聚集農業科技上的科學共同討論農業資料之標準化、結構化、鏈結化、及應用上的問題,這個會議是由GODAN ( Global Open Data for Agriculture & Nutrition)、 德國農業部(BMEL)、和德國農業科技與建立協會(KTBL)等三個單位來共同舉辦。
會議開場是由德國農業科技與建立協會(KTBL)的 Daniel Martini 主持。首先,由德國農業部(BMEL)官員致詞,說明會議舉辦的背景,是由於德國今年於漢堡(Hamburg)舉辦G20會議,並因此在波茲坦(Potsdam)舉辦G20中首席農業科學家會議(MACS),而去年的G20會議在中國時,就強調資通訊科技在農業上的應用與發展,延續這個議題,有鑑於歐盟近5年來在鏈結資料上的發展,德國今年則嘗試以鏈結資料在農業上的討論為主來承續中國在去年開啟的議題。而他也說明,雖然這是G20的會議之一,但這個會議其實不侷限於G20的成員參與,而是著重於農業和食物科學議題討論,而開放資料的策略提供更多在農業議題脈絡中創新的機會,有助於解決當前全球共同面對的農業和食物問題。
如何透過開放資料建立更好的農業和糧食資料的利用,進而解決問題,是GODAN計畫在尋找的解決方案,全球各地許多科研單位和科學家加入。他也強調,在剛結束不久的科研資料聯盟(Research Data Alliance, RDA)第10次會議於加拿大蒙特婁(Montréal)舉辦,其中有許多議題都和鏈結資料有關,而鏈結資料的技術與方法在農業和糧食問題的研究發展方興未艾,本次的會議就是想更深入去探討農業上的鏈結資料。
會議主辦方邀請Elsevier的Paul Groth博士,以 「The Roots: Linked Data and the Foundations of successful agriculture data」為題進行專題演講。Groth博士先自我揭露說,他的科學背景是電腦科學,著重於開放資料和鏈結資料,而非農業領域,但家鄉是荷蘭,是非常重視農業科技的國家,也算是和農業扯上邊。
他先以三個問題來揭開專題演講,這些問題也是整演講的脈絡。
鏈結開放資料如何能讓農業不同以往? (How can Linked Open Data make a difference in agriculture? )
什麼樣的技術門檻阻礙了這個發展? (What technical obstacles stand in the way?)
什麼樣的政策需要配合? (What policies are needed to achieve the potential?)
而研究科學資料在很早以前就開始討論資料開始的議題,在國際科學理事會(ICSU)帶領下,國際科學與技術資料委員會(CODATA)及研究資料聯盟(RDA)的會議中不斷地探討科學資料開放的議題,也使得投入科學資料開放的研究者愈來愈多,Groth博士以他為共同作者的Scientific Data期刊文章「The FAIR Guiding Principles for scientific data management and stewardship」為例,引導了科學資料中倡議開放資料的FAIR 原則,即是Findable, Accessible, Interoperable, 和Reusable,其節細內容如圖2,而達到FAIR原則所導向是成功的資料,而達成成功資料的最佳途徑就是鏈結資料。
圖2: FAIR原則 (來源: Wilkinson et al., M.D. 2016, The FAIR Guiding Principles for scientific data management and stewardship, Scientific Data 3, 160018)
The paradigm shift of the ImageNet thinking is that while a lot of people are paying attention to models, let’s pay attention to data. … Data will redefine how we think about models.
Groth博士進一步地以FAIR Data的概念來說明資料供應的標準和語彙如何強化資料的品質,在多資料來源和多使用者的平台上更加顯得重要,他就以全球變遷資料庫「The Global Change Information System」來說明如何利用W3C PROV (Provenance Vocabulary) 來幫助平台的資料品質。