從知識發掘與資料探勘看自願性地理資訊之價值

自願性地理資訊是集結群眾的地理資料,常常記錄一般人對於週遭環境的經驗、感受與喜好,而知識發掘與資料探勘則是綜合各種技術和方法以便從資料中擷取出有用的知識,如何善用知識發掘與資料探勘由自願性地理資訊挖掘出有用的知識成為新世代地理資料科學家課題,讓我們用幾個實際的案例來說明知識發掘與資料探勘帶來解決問題的潛力,以及自願性地理資訊帶來的新的研究視野。

知識發掘與資料探勘

由於網路科技的發展,資料在網路中持續地快速增長,如何有效去蕪存菁,找出資料有用的知識,以解決問題,成為一項挑戰,知識發掘與資料探勘(Knowledge Discovery and Data Mining, KDD)即是一個跨領域的科學,著重於利用各種方法由資料中擷取出有用的知識,這些方法包含統計學、資料庫、圖形辨識、機器學習、資料視覺化、最適化分析、和高效能運算等研究。傳統的地理資料處理方法不足應付當今巨量且多樣化地理資料,知識發掘與資料探勘在地理資訊科學逐漸被重視,近年來常被應用於了解複雜的地理現象,例如,人與環境交互影響和社會經濟動態,同時也著重在於真實世界的危急問題,例如全球氣候變遷和流行性疾病散播(Mennis and Guo, 2009)。

自願性地理資訊

資通訊科技的革新,Web 2.0世代的來臨,改變了網路使用者的角色,從傳統上的資訊消費者,轉變成提供網頁內容的資訊生產者,同時,這個轉變也帶動了地理資訊的改變。傳統上地理資訊的生產是需要透過專業訓練的人員來製作,這些地理資料生產的工作也多數集中在測繪製圖單位、學研機構,然而,上述網路環境的轉變,也帶動地理資料生產方式的改變,新興的資通訊技術,開創了網路上開放性協同合作架構,帶動了網路地圖技術的革新,加上全球定位系統(Global Position System, 簡稱GPS)裝置的普及,使得一般人很容易地就可以在網路上共同地生產出地理資料,例如,開放街圖(OpenStreetMap, OSM),即是一個協同合作的線上地圖,參與者並非都是地理資訊專家,透過網路共同地繪製且編修地圖,這個地圖的產生不是專家學者的規劃,再由訓練有素的人員來繪製,相對地,這是透過一般人以協同合作的方式來產生,他們自願地貢獻時間精力來參與地圖繪製,產生地理資料,這類的地理資料通常被稱為「自願性地理資訊」 (Volunteered Geographic Information, VGI)(Goodchild, 2007)。

群眾外包集體智慧

自願性地理資訊其實就是一種群眾外包(Crowdsourcing)[1]的地理資料,在群眾集體協同合作的完成工作,在同儕相互檢視與競爭下,在生產的資料中產生集體智慧。 由群眾參與的製圖而成的開放街圖,縱然在一些區域的完整度和正確性仍有不足,但讓人驚艷的地方是,有許多地區已經達到商用水準,如西歐、美國、和日本,且與專業的地理資訊的品質亦相去不遠(Haklay, 2010),而包含於開放街圖中的知識,常成為補充專業性地理資訊不足的資源,以香港大學為主的研究團隊,他們利用開放街圖資料擷取土地坵塊的特性與類別,以便進行都市規劃(Liu and Long, 2015),而芬蘭國家土地測量局的一項研究也利用開放街圖擷取自行車道的資料,進而分析自行車道受歡迎的程度(Bergman and Oksanen, 2016)。

社群媒體的地理資料

除了開放街圖,事實上,有更多的自願性地理資訊是來自於社群媒體的使用,使用者為了分享訊息於社交網絡中,常常附帶一組地理座標於照片或文字中,使得這些分享的內容成為地理資料,這樣的地理資料,在多數情況下,不是事前的規劃才去產生的資料,而是一般民眾在日常生活中對週遭環境的觀察與感想,藉由社群媒體中分享於親朋好友,進而逐漸累積成有意義的資料,舉例而言,Flickr是知名的照片分享平台,提供使用者以標籤(tag)分類照片,當一地名被當成標籤而使用於帶有地理座標的照片時,這些照片所形成空間範圍,則可以表示一般人對於該地名所認知的空間範圍,圖1中所顯示的是以「公館」為標籤且帶有地理座標的照片所群聚出之區域,從圖上可以明顯看出,台北市內的公館是以新生南路到基隆路間的羅斯福路為基礎,並往北方的新生南路、東北方台灣大學校園、西南方的寶藏巖擴展,也就是說,當一般人提到台灣大學附近的公館時,其心裡所認知的空間範圍有可能不只有水源市場附近,而是更大的範圍。

圖1: 有「公館」為標籤且帶有地理座標的照片所群聚出之熱區圖

文字訊息是社群媒體中主要的內容,目前己經有許多研究和應用利用文字探礦(Text mining)的方法,由社群媒體的文字訊息來獲取有用的資訊或知識,例如預測群眾運動的發生、輿論的發展趨勢、商品的網路口碑、和災情分析等,同樣的,文字探礦應用於社群媒體也為地理資訊研究帶來不同視野,仇恨的地理(The Geography of Hate)是洪堡德州立大學(Humboldt State University)史蒂芬斯博士(Monica Stephens)團隊所執行的計畫,這個計畫的動機和剛卸任美國總統歐巴馬(B. Obama)有極大關係,他在第二任當選時,不滿他當選的人在推特(Twitter)中大量用歧視性字眼攻擊他,如黑鬼(nigger)和猴子(monkey),歧視性字眼的使用代表著仇恨、忿怒的負面情緒,而這些推特文(tweets)帶有地理座標,可標示於地圖,因此可以呈現出這些「仇恨」的地理空間分佈。該研究團隊收集2012年6月到2013年4月間,超過15萬筆的推特文,利用情感分析(sentiment analysis)將推特文分類,並依照情緒字眼所設計的量表,來區分出正面、中立、和負面,研究團隊不僅處理了對於種族仇視情緒,也處理了同性戀和身障者的仇視程度,當負面的仇恨情緒愈高時,在地圖上顯示的就愈紅、反之則愈藍,圖2所顯示的是黑鬼(nigger)的仇恨情緒的空間分佈,呈現出美國東西二岸相當不同的結果。

圖2: 黑鬼(nigger)的仇恨情緒的空間分佈 (http://users.humboldt.edu/mstephens/hate/hate_map.html)

GPS航跡中的時空間樣態

事實上,GPS航跡是自願性地理資料中不可或缺的一塊,許多人常會把跑步、自行車、開車、登山健行等活動所記錄的航跡分享,透過時空間這些航跡常常可以擷取出一些有意義的事件或地點。德國弗勞恩霍夫爾智慧分析與資訊系統研究所(Fraunhofer Institute IAIS)為主的研究,他們在義大利米蘭中收集了17,241部車子於一週中的GPS航跡,如圖3所示,利用時空間群聚分析把時空間行為相似的航跡歸類,並且區分出塞車事件和興趣點,圖4即是研究團隊從龐雜的GPS航跡中歸類出有意義的事件(Andrienko et al., 2011)。此外,北京大學為首的研究團隊分析北京市的塞車樣態,他們收集北京市中28,519部計程車在24天的GPS航跡,不但以時空間群聚分析把塞車事件區分出來,而且進一步地區分同一路段不同方向塞車樣態,圖5中說明了(a)路段是北三環路,很規律地在週間7:30-10:00和13:30-18:30二個時段都容易塞車,(b)路段的車速偏低,因為是在二個小學間,但週間的7:30-8:00時段是接送學生的時間,最容易塞車,(c)和(d)都是在北京西站旁的隧道,但分屬二個方向,一方向容易在早上塞車,而另一個在下午塞車,一大筆的GPS航跡若不經過處理很難看得出塞車(Wang et al., 2013),但經過適量處理後,不但可以發掘城市中的塞車樣態,可以了解市民的生活動態。

圖3:在米蘭一週中的GPS航跡之時空間分佈(Andrienko et al., 2011)
圖4:以時空間群聚分析從GPS航跡中歸類出有意義的事件(Andrienko et al., 2011)

 

圖5:利用GPS航跡以時間空視覺化分析北京市塞車樣態(Wang et al., 2013)

價值: 地理學研究再進化

自願性地理資訊帶來許多探究真實世界的可能性,而知識發掘與資料探勘的方法則是允許研究人員從資料中挖掘出知識的方法,利用合適的方法從自願性地理資訊中挖掘知識則為地理資訊科學帶來另一個視野,讓我們有可能更深入地了解人與環境的交互影響、區域特性和人文自然現象的空間分佈,即是應用知識發掘與資料探勘於自願性地理資訊的價值。

參考文獻

  1. Andrienko, G., N. Andrienko, C. Hurter, S. Rinzivillo3, S. Wrobel1 (2011) From Movement Tracks through Events to Places: Extracting and Characterizing Significant Places from Mobility Data, Proceeding of IEEE Symposium on Visual Analytics Science and Technology, pp.159-168, October 23 – 28, Providence, Rhode Island, USA
  2. Bergman, C. and J. Oksanen (2016) Conflation of OpenStreetMap and Mobile Sports Tracking Data for Automatic Bicycle Routing, Transactions in GIS, 2016, 20(6): 848–868.
  3. Goodchild, M.F. (2007), Citizens as sensors: The world of volunteered geography, GeoJournal, 69 (4): 211–221.
  4. Haklay, M (2010) How good is volunteered geographical information? A comparative study OpenStreetMap and Ordnance Survey datasets, Environment and Planning B: Planning and Design 37:682-703.
  5. Liu, X. and Y. Long (2015) Automated identification and characterization of parcels with OpenStreetMap and points of interest, Environment and Planning B: Planning and Design, 43(2): 341–360.
  6. Mennis, J. and D. Guo (2009) Spatial data mining and geographic knowledge discovery – An introduction, Computers, Environment and Urban Systems, 33: 403-408.
  7. Wang, Z., M. Lu, X. Yuan, J. Zhang, and H. van de Wetering (2013) Visual Traffic Jam Analysis Based on Trajectory Data, IEEE Transactions on Visualization and Computer Graphics, 19(12): 2159-2167

[1]群眾外包(Crowdsourcing)一詞是傑夫×豪伊(Jeff Howe)於2006年《連線》雜誌中所創造出的新詞,這個詞說明了當時正在發展趨勢,即是企業或組織的工作透過網路向廣大的群眾邀請,來提出解決問題想法(例如,因應氣候變遷的對策)、提供資源(例如,照片)、甚至簡單的勞務(例如,收集資料),最後,企業或組織聯合群眾一起共同地完成工作。群眾外包和外包(outsourcing)不一樣,外包(outsourcing)是將特定工作指派給特定的企業、組織、或個人,雙方會有一定的勞雇關係,而群眾外包是邀請廣大的群眾參與工作,強調協同合作的夥伴關係,參與者常常是自願者,也有可能得到一些回饋。

 

來一場超級杯的地理資料視覺秀!

之前使用過Torque去呈現台灣地區OSM的2012年中編輯的歷程

沒想到CartoDB自已做的案例更酷了! 利用2015年SuperBowl期間的Twitter資料做一場資料秀,其實資料的處理不難,先在Twitter API上取出了含有#SB49的推文(tweets),區分出是新英格蘭愛國者(@Patroits)和西雅圖海鷹(@Seahawks),藉由推文(tweets)上帶有的xy座標,就可以將推文定於地圖上。當然,因為使用CartoDB所推出的Torque.js,這些資料必需匯入CartoDB,而這就是CartoDB的商業模式,它提供很好的地理視覺化工具,但資料量大或瀏覽量高時,就必須收費了!

這場超級杯的資料視覺秀,很有趣!

在18:30開場時,綠點海鷹充滿了西雅圖,而紅點的愛國者則聚集在新英格蘭,一開始就有地域上的差 異。

Screenshot 2015-02-11 17.45.24

在19:13時,新英格蘭首度觸地得分,頓時紅成一片。而19:36時,換海鷹得分則整個變成綠色。比分7:7平手!
touchdown_patriots#SB2015touchdown_seahwaks#SB2015

後來雙方再各得7分,在中場時,還是14:14的平手局面。而超級杯一直是美國本土收視率最高的節目,今年(2015)還破了最高收視率,而中場秀一直眾所矚目的焦點,廣告收益頗為驚人,然而,Katy Perry(@katyperry),我實在不認識,冏! 但從推文的量看得出來她果然是推特(Twitter)關注度高的女星。

@katyperry#SB2015

這場比賽非常戲劇化,海鷹和愛國者一路互有得分,但第四節前,海鷹一度是領先10分,但愛國者在第四節一路追趕,逆轉局面,雖然在終場前,海鷹落後3分,但球權在海鷹手中,且已經來到Goal line前不遠,只要一個touch down就完全翻盤,但關鍵出現在最後的26秒,受國者的菜鳥Malcolm Butler,居然抄掉海鷹四分衛 Rusell Wilson的傳球,而斷送海鷹的一線生機。因此,終場雖然是愛國者贏了比賽,海鷹的球迷幹譙聲浪應該不小,使得顏色有點慘綠了 XD! 整場的Highlight在Youtube,可以看得到,透過這樣地理視覺化,更讓人可以了解到球迷的動態。

Mac_BZ#SB2015

 

開放街圖(OSM)將成為谷歌地圖(Google Map)的最大爭競者嗎?

常有人問起,開放街圖(OpenStreetMap)能不能商業化? 或開放街圖能有什麼商機? 隨著上個月Telenav宣布他們的產品Scout捨棄了與TomTom的合作關係,而轉為使用開放街圖,這個問題似乎有一個強而有力的答案。事實上,不少網路媒體、甚至是紐約時報都認為TeleNav的做法將為適地性服務(Location-Based Service, LBS)和導航產業的市場帶來許多衝擊和轉變,但就一個圖客(Mappers)而言,開放街圖能被一家具規模的導航公司所使用,其實背後有更有意義。

TeleNav uses OSM

利用開放街圖為導航地圖這件事並不新鮮,開放街圖的維基上有一堆這些的服務,但能被一個在那斯達克(NASDAQ)上市的導航商所用,就別具意義,顯示出群眾外包(Crowdsourcing)的地圖己經被重視,且逐漸進入商業使用的階段。然而,群眾外包的地圖最大的疑慮是資料品質,像開放街圖在這種開放的系統,誰都可以來畫地圖,很難保證被畫上的地圖是正確的,但開放街圖並沒有太多的限制,每個帳戶是平等的,只要有一個帳號,誰都可以去畫地圖、改地圖,在沒有自動檢核機制之下,靠的是圖客們的檢視,愈多人使用,正確就會愈高,就和開放源碼一樣,符合所謂的Linus’s Law (given enough eyeballs, all bugs are shallow)。TeleNav捨棄了與TomTom合作,敢用群眾外包的圖資,顯示處理開放街圖到導航可使用的水準之成本己經不高,與其花錢去買地圖公司的圖資,倒不如把錢拿來處理開放街圖,讓自己的公司充份地掌握自己的LBS服務商品中的地圖,不用只與一家地圖公司合作,地圖圖資被一家公司所掌握。所以TeleNav在今年(2014年)1月底先以2千4百萬美元買下在德國柏林的新創公司Skobbler,其實就是想買進轉換開放街圖資料的技術,就更不用說,Steve Coast在去年(2013年)9月從Microsoft跳槽到TeleNav,早早在為使用開放街圖做準備。

地圖內容己經不是單純地是單一地圖公司提供就可以滿足現今適地性服務(LBS),Google在去年(2013年)6月也是約13億美元天價買下以色列的LBS新創公司其目的就是提供地圖與用戶互動服務,讓用戶可以透過地圖的使用能回饋到Google Map,而能讓地圖內容更符合用戶需求,當然戰略上也是為了Waze不讓Facebook或Apple給拿走,去擴增適地性服務(LBS)。 適地性服務(LBS)與社群媒體(social media)二者己經是密不可分,一方面,地圖內容如何透過社群媒體結合更多用戶來改善地圖內容、提高更新速度,另一方面,如何透過地圖使用行為,來改善適地性服務(LBS)方式,以提供更貼近人心的地理服務,無論如何,用戶才是決戰的重點,Waze號稱他們在全球有5千萬個用戶,而開放街圖呢?2014年開放街圖的全球註冊的用戶已經達160萬人,這個數量與Waze顯然有很大的差距,但二者用戶的本質是相當不同的,開放街圖註冊用戶是地圖的貢獻者,不是單純的使用者,反觀有多少人在Waze上貢獻資料呢?TeleNav當然看上這點,上那找這麼多的地圖貢獻者來繪製、編修地圖,開放街圖的社群成自然而然成為最好的後盾。

TeleNav使用開放街圖的案例,事實上就是一個開放資料成功的應用案例。就TeleNav而言,TeleNav花的錢並不是買圖資,而是技術,TeleNav所省下的成本可以用來增強導航功能,而使得他們的產品在市場上更有競爭力,另一方面,開放街圖並沒有因為TeleNav或其它廠商的使用,而更動它本來既有的運作方式,從繪製編修地圖到社群的活動都不會因為這樣而改變[註1]。一樣的道理,在談開放政府資料加值或者是產業,就是在於開放政府資料如何省去廠商資料成本,而能專注地在於技術服務的開發,這對於新創公司其實是大利多的,因為過去政府許多資料不是很貴,就是開放授權講不清,往往是有管道、有關係、大資本的公司才可以拿到資料,透過政府開放資料,免除了這樣的問題,新創公司能專注於資料使用上的創意,而不是在資料取得就己經先吃癟,怎麼能夠期待有創意,更沒辦期待像Skobbler這樣的公司出現。

因此開放街圖所開創的經濟模式,有別於以往Google Map的模式,各位可以看看,在最近5年來的競合之下,走Google Map模式的地圖商、導航商,其實只剩下Google Map了,不但國際大廠連連整併,就連Local的地圖服務商也很難掙下去,台灣有UrMap呀! 現在有多少人還用?我相信TeleNav的案例一定會帶給許多人啟發,但走開放街圖的模式是否能夠成功,這無法保證,但絕對會是另一個機會,隨著開放街圖的成熟,一定會有愈來愈多人拿來商業使用,逐漸成為有別於Google Map模式的競爭者。

[註1]有中國人前陣子頻頻大規模的修改地圖,把台灣的地名都改成簡體了,猜想和TeleNav在中國也有分公司,要在中國地圖產品,必需符合中國法律有關

利用Facebook的加速科學研究:群眾外包式魚類辨識

這是一個利用Facebook促進科學研究加快的故事。簡單地說,研究人員因為採集大量的魚類照片,自已辨識的話,得花費不少時間,因此計畫主持人的學生提議將照片放上Facebook將他們的朋友們來幫他們辨識這些照片,當然他們的朋友多數也是魚類或生物得家,而照片放上Facebook的24小時後,就有90﹪的照片已經被辨識,這個成功的故事就這樣登上了Science期刊!

Facebook的頁面

Posted by Brian Sidlauskas on Tuesday, February 8, 2011

Video:
http://shelby.tv/video/youtube/8hhXZwLFfao/facebook-stories-speeding-up-science

文章原稿:
Science. 2011 Apr 29;332(6029):537.
Life in science. Ichthyologists hooked on Facebook.
Sidlauskas B, Bernard C, Bloom D, Bronaugh W, Clementson M, Vari RP.

Ichthyologists Hooked on Facebook

The Cuyuni River, which runs from Venezuela through Guyana and into the Atlantic via the Essequibo River, harbors hundreds of fish species. Although much of the river flows far from civilization, pollution from gold mining and other environmental hazards threaten its rich community of wildlife. Earlier this year, a small group of us from the United States and Guyana set out to perform the first comprehensive survey of the river’s fishes with support from the Biological Diversity of the Guiana Shield program at the Smithsonian’s National Museum of Natural History. We aimed to determine which species still thrived in the river, which might have disappeared, and whether any of the remote river’s denizens were entirely new to science.
We arrived in January, during the dry season, and embarked for two weeks of collecting and camping along 200 km of rainforest-lined river.

Local boatmen helped us navigate the often perilous river, and each day, we stood neck-deep in the muddy waters and pulled wide nets to catch samples of the life teeming beneath the surface. One student, Whit Bronaugh, photographed each species as the collection grew to hundreds, and then thousands, of fishes large and small.

Upon returning to Georgetown (Guyana’s capital), a major challenge confronted us. As a condition to securing an export permit, we had just one week to complete a detailed report with each of our 5000 specimens identified to genus and species. Given the limited library resources at our disposal and the time constraint, the task seemed impossible.

Then one of the students, Devin Bloom, suggested posting our many photographs on Facebook and inviting the ichthyologists among our circle of friends to help us identify them. Would that far-flung community take the time to help us? We decided to find out.
We posted the photographs (1), and within minutes comments began to pour in. “They look like fish to me” one commenter cheerfully acknowledged. On an anchovy, another noted, “Pizza topping.” But before long, more insightful messages began to appear. On a catfish: “would say Megalechis personata,” followed by another suggestion, “my guess would be Megalechis horacatum.” Amazed, we collected identifications from our friends, and then from friends of friends, contributing their expertise from around the world. Less than 24 hours later, 90% of our specimens were identified. Armed with our export permit, we packed
our specimens for shipment and returned home, grateful beyond words for the generosity of our colleagues, and for the social network that allowed us to harness their vast collective expertise and provide faster and more accurate identifications than we ever would have dreamed possible.

群眾外包的訊息平台 — Ushahidi

Ushahidi 是一套著名的群眾外包 (Crowdsouring) 平台,被運用在許多世界上重大的災難事件中,它的出現是因為2007年非洲肯亞總統大選出現爭議而暴動,為收集肯亞各地暴動資訊,Erik Hersman等人建立了一個以電子郵件和簡訊方式收集暴動事件之資訊,並顯示於Google Map 上,此平台並命名為 Ushahidi ,即為非洲斯瓦希里語 (Swahili) 的「證詞 (testimony)」或「證人 (witness) 」之意,而 Ushahidi 以收集群眾所提供的災難資訊,並繪製於地圖上的方式,也稱為災難地圖 (Crisis Map) 。
Ushahidi平台建立於 Kohana 網頁架構,也就是一個PHP 5 為基礎,提供許多豐富的套件以用來建立網頁, 為 CodeIgniter 架構 (PHP 5 開發環境) 的一個分支。在簡訊收集方面,Ushahidi並內建 Nexmo,用來處理大量手機簡訊(Shot Mobile Message)的API,以及 Clickatell 來提供收集簡訊閘口 (gateway),此外,Ushahidi 也常使用 FrontlineSMS 來收集使用者所發送的簡訊。在地圖顯示方面,Ushahidi使用OpemLayers套件為災難訊息地理視覺化的工具,使用者透過這個套件可以將災害訊息定位,所收集的災難訊息也可以分門別類地顯示於地圖上。圖1為我們所建立的測試平台。

圖1: 我們所建立的Ushahidi測試平台
圖1: 我們所建立的Ushahidi測試平台

SwiftRiver是擴充Ushahidi資料收集的系統,該系統結合自然語言處理和資訊探礦的處理套件,能分析使用者所上傳資料,如Twitter和簡訊,在短時間內,幫使用者分類並提供使用者充份的背景資訊,讓使用者更容易提供資訊,另一方面,資料收集者也因為充份對上傳的災害資訊分析,能有效地歸類整理災害資訊,而使所收集的資訊能加以利用,因此SwiftRiver被定位為具有所生產一個智慧且即時的資料收系統。SwiftRiver具有三個主要功能:1) 組織未結構化資料、 2) 條件式過濾和即時分辨上傳訊息的優先程度、 3) 加入有意義的脈給 (context) ,如位置,圖2為SwiftRiver的使用介面,對於來自於Twitter的事件報告,可以進行內容的過濾與辨識,以利後續分類及訊息分送。

圖2: SwiftRiver的使用介面
圖2: SwiftRiver的使用介面

Ushahidi在世界各地及重大災難事件的使用

(1) 2010年海地地震

在2010年海地地震發生沒多久,哈佛大學人道計畫(Harvard Humanitarian Initiative) 發起人之一, 利用Ushahidi 開啟了一個三個單位聯合的海地人道救援計畫,包含美國塔夫茲大學佛萊契爾法律外交學院(The Fletcher School of Law & Diplomacy at Tufts University)、哥倫比亞聯合國人道事務協調辦公室(UN OCHA/Colombia)和危機資訊製圖者國際網絡(the International Network of Crisis Mappers (CM*Net)),在該計畫開始後的幾個小時,即有許多的人道救援和技術的工作者加入,近40000筆的事件報告被傳送到這個海地地震的Ushahidi,之中有約4000筆的事件被標示於地圖中,圖3這個海地地震的Ushahidi。

圖3: 用來收集與報導2010年海地地震之相關災害訊息的Ushahidi
圖3: 用來收集與報導2010年海地地震之相關災害訊息的Ushahidi

(2) 2011年紐西蘭基督城地震
在2011年2月22日的紐西蘭基督城地震後24小時, 基督城復原地圖(Christchurch Recovery Map) 即利用 Ushahidi 建立起來,該網站標示了重要物資訊息,如食物、水、廁所、燃料、ATM和醫藥用品,其訊息由Twitter以#eqnz這個雜湊標籤、簡訊和電子封件來收集,這個網站由一群網站專業工程師和志工來建立與維護,如圖4所示。

圖4: 基督城復原地圖
圖4: 基督城復原地圖

(3) 2012年東日本大地震

2012年東日本大地震之後,Ushahidi被使用來交換傳遞地震災情與救援相關訊息。圖5為利用Ushahidi建立的日本復原地圖。

圖5: 日本復原地圖
圖5: 日本復原地圖

(4) 2011年美國密蘇里河洪水

MightyMoRiver 計畫是使用 Ushahidi 為 Crowdmap.com 服務的平台來追蹤2011年美國密蘇里河洪水的災害事件。

圖6: 密蘇里河洪水事件災害地圖
圖6: 密蘇里河洪水事件災害地圖

(5) 馬其頓共和國的貪腐事件報告

透明觀察計畫是使用 Ushahidi平台來追蹤馬其頓共和國的貪腐事件, PrijaviKorupcija是一個由馬其頓國際透明組織(Transparency International – Macedonia)和國際關係中心(Center for International Relations)聯合的計畫,旨在使公民可利用手機簡訊、電子郵件和twitter的雜湊標籤#korupcijaMK 來報導馬其頓貪腐事件。

圖7: 馬其頓共和國的貪腐事件地圖
圖7: 馬其頓共和國的貪腐事件地圖

“仇恨”的地理空間

Geocommons-an example of black swan
GeoCommons中GeoIQ以電影黑天鵝為例的情緒地圖

過去群眾情緒性(sentimental)的空間分佈很難大規模的被顯示出來,原因是資料的採集不容易,但隨著「社群媒體」(Social media)的發達,有愈來愈多的人在這些平台發表自已的言論,這些帶有情緒的言論集結起來,可以多少窺探群眾情緒的走向,因twitter所發出的tweets可以夾帶地理座標,更可以了解這些情緒的tweet由何處發送出來,例如,GeoCommons 曾經以黑天鵝(Black Swan)電影為例,說明即使這部電影得到奧斯卡,在群眾的感受有許多負面的情緒。

二週前,美國加州的洪堡德州立大學(Humboldt State University)地理系助理教授  Dr. Monica Stephens  帶領三位學生,分別為  Amelia Egle, Miles Ross and Matthew Eiben,分析tweet中關於歧視的字眼,將帶有歧視字眼和有地理座標的tweet,利用Google Map的Heat Map API用來製作一系列所謂的「仇恨」的地圖,名為 The Geography of Hate,他們擷取在tweets中帶有歧視性的字眼,大部份與種族歧視有關,如下列:

Homophobic: Dyke, Fag, Homo, Queer

Racist: Chink, Gook, Nigger, Webback, Spick

Disability: Cripple

overall hate map
整體的「仇恨」地圖

完整用來擷取仇恨的歧視性字詞在官方部落格(floatingsheep)中的Q&A 有較完整的介紹。而製作這個地圖的動機與現任美國總統Obama再次當選有極大關係,不滿Obama當選的人大量用  nigger 和monkey 在tweets中,因此歧視字眼的使用可能代表著更多仇恨、忿怒的情緒,加上利用tweet中地理座標標示於地圖,呈現出「仇恨」的地理空間分佈,以總體而言,東岸的人的「仇恨」的情緒較多。

幾個月前,ESPN記者用”Chink in Armor”來形容林書豪表現的低潮, “Chink”一詞,在維吉尼亞州和中明尼蘇打州是最高,沒有在美國久待,難以了解實情為何? ”wetback“是指在美國的墨西哥非法移民,但有點被引伸到整個中南美州非法移民,這個空間地理分佈就很有意思,多數出現在德州一帶,顯示出地域性的特色。

事實上,就技術面而言,這個地圖所使用的都是一些簡單工具和方法,但用歧視字眼來呈現仇恨情緒是一個很有趣的想法,也的確顯示出一些空間樣態,但值得注意的是,一地區中的人使用歧視字眼在他們的tweet中,就代表他們對某一族群的人有仇恨的情緒?有多少tweets使用了某個歧視字眼才算是「恨」呢?單一的資料來源是否就能夠充份說明呢?這應該是值得深入探討的。

 

chink in hate of geography
Chink
wetback in hate of geography
Wetback

 

 

 

 

 

 

 

Enhanced by Zemanta

群眾外包的交通時況—Google Map traffic layer

日前與友人聊天時談到Google Map的交通時況是收集 Android的智慧型手機上的資訊,當時有點驚訝,我一直以為Google Map是使用交通部的TMC(即時交通資訊廣播),經過一番調查與測試,沒錯! Google Map 上的交通時況就是Crowdsourcing,就是千千萬萬Android 用戶貢獻的,幾點提出來來大家分享:

一、Google Map Traffic 所涉及的範圍比交通部的TMC還廣

TMC在許多都會區道路上都有架設收集的點,但鄉村地區則不足,但Google Map上卻常常有資訊,舉例在草屯鎮,在交通部服務e點通 的地圖上中二高和水沙璉高速公路都有會交通路況,但草屯市區道路看不到路況資訊,在TMC的建置計畫中也沒有草屯鎮道路的資訊,但在Google Map上,有幾條道路顯示出路況。

Screen shot 2013-05-10 at 2.05.54 PM
TMC
Screen shot 2013-05-10 at 2.06.05 PM
Google Map Traffic

 

 

二、Google Map 導航的時間估算變得比較準確

以前使用Google Map 路線規劃,時間的預估和實際狀況有時候因為塞車,使得交通時間變長,曾幾何時,Google Map路線規劃也把交通狀況考慮進去,使得路線規劃的時間變得比交符合現況,或許從Google Map的blog中可以看出一底端倪。從Mashable的這篇報導中,更加讓人確信Google Map Traffic Data是使用Android用戶。

Data is gathered through third-party services and through information from Android users who have opted in to the My Location feature on Google Maps. Google would be able to tell, for instance, if there were several Android owners moving slowly on the freeway and determine that there was traffic slowing them down. The more people opting into the service in the area, the better the traffic information available will be.

 

三、Google Map Traffic會出現一些與現實路況不符的情形

根據觀察,Google Map交通時況在中研院門口附近於中午時候,常有塞車的情況,但事實是如此嗎? 想想中午的時候有許多人用“走”出去吃飯,如果Google Map交通時況是集合Android GPS訊號而轉換得到的資訊,這些被標示塞車的路段,可以合理的被懷疑是因為集合多數人”走”速度,而讓Google Map交通時況的判斷為塞車?

Screen shot 2013-05-10 at 1.41.21 PM
中午時,中研院附近的Google Map Traffic

 

Enhanced by Zemanta

開放街圖研討會 State of the Map (SotM) 2012

其實2005年就加入OSM成為Mapper,2010年才註冊為OSM Foundation會員,從沒有參加過每年一次OSM的研討會(State of the Map),一直是一個單純的mapper。在我的研究領域中,OSM是一個研究標的,如Muki Maklay 所建議,研究人員應該站在局外人的角度來看OSM,也因此長久以來,我並不想涉入太多OSM體制內的事,然而,2011年底,從荷蘭返台後,逐漸覺得台灣雖然有OSM社群,但多數台灣人是不知道OSM是什麼的,開始有想法在台灣來推動OSM。

SotM 2012 會場東京大學駒場校區 Tokyo University Komaba Research Campus

對於我而言,推動OSM中的第一步就是參加SotM 2012,去這種大會有機會和許多高手或主要成員聊天,也才有可能進一步了解OSM內部的運作模式。很幸運的,年初宣布2012年SotM在日本東京舉辦,台灣和日本地理上算是近的,台灣的社群怎麼可以不去,所以鼓吹台灣OSM重要的二個推手,LouisSin-Di也一起參加,Louis的高雄市公車被接受於大會中演講,看到台灣社群如此積極的參與,會議的主要組織者之一 Daniel Kastl 還說他在這之前從來不知道台灣社群如此活躍。在大會開始前,主辦單位將投稿內容做成tag cloud,Taiwan可是主要的tag之一。

會議的三天的議程相當豐富,有來自於世界各國的OSM Mappers的報告,包含災害救援、導航技術、製圖技術和社群發展。第一天所有的主題都與防救災有關,自海地地震後,OSM就一直和救災相關議題有相當強的連結,因為2011年東日本大地震的關係,如何用OSM來救災也成為日本重要的議題,因此有4個講題是來自東日本大地震間使用OSM製圖的經驗和技術,其中Kinya Inoue先生就是福島人,當他述說著福島在東日本大地震前和後,地圖如何改變,提到過去的朋友和親人在這樣的巨變中喪生,每每不能控制自已,同時,讓在場每一個參與的人動容。我也註冊了第一天的Lightning talk,簡單介紹了如何使用簡易輻射計數器來量測環境輻射,以抵抗台電官方輻射安全的說法,當時舉的例子就是蘭嶼,不過這個計畫因為沒有順利拿到Safecast的裝備而延宕中。

Steve Coast 在SotM 2012的開場

第二天,二個keynotes很有趣,Jaak利用OSM來環境整潔(clean up)計畫。接著,Raul Krauthausenwheelmap.org的創辦人,報告了wheelmap成立的經過,他本身就是殘障人仕,個人覺得這個應用對於殘障人仕是相當有幫助的,可以用地圖查詢和瀏覽公共空間是否有殘障設施,在這之前就已經知道這個應用,現在Sin-di正在將它中文化。上午的整個session都在談如何用OSM做導航或路徑規劃,Louis 在keynote後上場,這是一個相當實務的經驗,拿OSM的地圖來做公車導航,他一開始就用日本地名開了一個玩笑,會後Mapping party要去的地點是高尾山(Mt. Takao),就是高雄舊名打狗,他玩趣的說,我今天要講的地點是Takao,但不是你們將去的Takao,我講的Takao需要買機票坐飛機去,全場笑了!下午換了跑道到日本語的track,本來是想聽聽如何做GPS logger,但講者不知道為什麼沒有來報告。晚上的宴會是在東京灣的船形屋(YAKATA-BUNE)宴會,吃不完的生魚片,喝不完的啤酒,吃飽喝足再上船頂欣賞東京灣的夜景,很棒的晚宴。

船形屋宴會

第三天,除了探討資料品質和停車格製圖外,引起我比較多關注的是利物浦大學教授Bob Barr的演講,他以Pirate 和Pilot 辯思在他(mappers)在OSM中所扮演的角色,風趣幽默的演講方式引人入勝,也帶入mapper在OSM所扮演的角色的思考。接下來4個mapping的talks都相當棒,就不一一介紹,印象深刻的是Kinya Inoue先生,就是之前講福島災後製圖的那位,他的英文表達能力有限,但內容極豐富有趣,是一個了不起的mappers,或OSM製圖家? 下午的talks一樣精彩,老實說我差一點就跑去閒逛,因為已經第三天的了,但最後一個talk,讓人精神大振,Tim Waters講你知道什麼時候對OSM上癮,可能是在場都是癮頭很重的mappers (不然怎麼大老遠從世界各地來),他舉的例子搞的大家笑不停。

這不知道是不是SotM的傳統最後一天,把所有東西都拿來拍賣了,包含最大的banner,一個也不剩,這樣籌錢是一個不錯的方式,因參加者來自世界各國,自從澳洲幣首先出來鬧場後,各國的錢幣紛紛出場,台幣也加入這場混戰中, Louis和Sin-di最後拍得一條用途十分廣大的方巾和一瓶日本酒。

再多相關報導來自於日本

[1]趣味のインターネット地図ウォッチ,第144回:世界のマッパーが来日した「オープンストリートマップ」の国際会議

[2]“地図のWikipedia”OpenStreetMapの国際会議が日本で初開催

 

Enhanced by Zemanta