“仇恨”的地理空間

Geocommons-an example of black swan
GeoCommons中GeoIQ以電影黑天鵝為例的情緒地圖

過去群眾情緒性(sentimental)的空間分佈很難大規模的被顯示出來,原因是資料的採集不容易,但隨著「社群媒體」(Social media)的發達,有愈來愈多的人在這些平台發表自已的言論,這些帶有情緒的言論集結起來,可以多少窺探群眾情緒的走向,因twitter所發出的tweets可以夾帶地理座標,更可以了解這些情緒的tweet由何處發送出來,例如,GeoCommons 曾經以黑天鵝(Black Swan)電影為例,說明即使這部電影得到奧斯卡,在群眾的感受有許多負面的情緒。

二週前,美國加州的洪堡德州立大學(Humboldt State University)地理系助理教授  Dr. Monica Stephens  帶領三位學生,分別為  Amelia Egle, Miles Ross and Matthew Eiben,分析tweet中關於歧視的字眼,將帶有歧視字眼和有地理座標的tweet,利用Google Map的Heat Map API用來製作一系列所謂的「仇恨」的地圖,名為 The Geography of Hate,他們擷取在tweets中帶有歧視性的字眼,大部份與種族歧視有關,如下列:

Homophobic: Dyke, Fag, Homo, Queer

Racist: Chink, Gook, Nigger, Webback, Spick

Disability: Cripple

overall hate map
整體的「仇恨」地圖

完整用來擷取仇恨的歧視性字詞在官方部落格(floatingsheep)中的Q&A 有較完整的介紹。而製作這個地圖的動機與現任美國總統Obama再次當選有極大關係,不滿Obama當選的人大量用  nigger 和monkey 在tweets中,因此歧視字眼的使用可能代表著更多仇恨、忿怒的情緒,加上利用tweet中地理座標標示於地圖,呈現出「仇恨」的地理空間分佈,以總體而言,東岸的人的「仇恨」的情緒較多。

幾個月前,ESPN記者用”Chink in Armor”來形容林書豪表現的低潮, “Chink”一詞,在維吉尼亞州和中明尼蘇打州是最高,沒有在美國久待,難以了解實情為何? ”wetback“是指在美國的墨西哥非法移民,但有點被引伸到整個中南美州非法移民,這個空間地理分佈就很有意思,多數出現在德州一帶,顯示出地域性的特色。

事實上,就技術面而言,這個地圖所使用的都是一些簡單工具和方法,但用歧視字眼來呈現仇恨情緒是一個很有趣的想法,也的確顯示出一些空間樣態,但值得注意的是,一地區中的人使用歧視字眼在他們的tweet中,就代表他們對某一族群的人有仇恨的情緒?有多少tweets使用了某個歧視字眼才算是「恨」呢?單一的資料來源是否就能夠充份說明呢?這應該是值得深入探討的。

 

chink in hate of geography
Chink
wetback in hate of geography
Wetback

 

 

 

 

 

 

 

Enhanced by Zemanta

群眾外包的交通時況—Google Map traffic layer

日前與友人聊天時談到Google Map的交通時況是收集 Android的智慧型手機上的資訊,當時有點驚訝,我一直以為Google Map是使用交通部的TMC(即時交通資訊廣播),經過一番調查與測試,沒錯! Google Map 上的交通時況就是Crowdsourcing,就是千千萬萬Android 用戶貢獻的,幾點提出來來大家分享:

一、Google Map Traffic 所涉及的範圍比交通部的TMC還廣

TMC在許多都會區道路上都有架設收集的點,但鄉村地區則不足,但Google Map上卻常常有資訊,舉例在草屯鎮,在交通部服務e點通 的地圖上中二高和水沙璉高速公路都有會交通路況,但草屯市區道路看不到路況資訊,在TMC的建置計畫中也沒有草屯鎮道路的資訊,但在Google Map上,有幾條道路顯示出路況。

Screen shot 2013-05-10 at 2.05.54 PM
TMC
Screen shot 2013-05-10 at 2.06.05 PM
Google Map Traffic

 

 

二、Google Map 導航的時間估算變得比較準確

以前使用Google Map 路線規劃,時間的預估和實際狀況有時候因為塞車,使得交通時間變長,曾幾何時,Google Map路線規劃也把交通狀況考慮進去,使得路線規劃的時間變得比交符合現況,或許從Google Map的blog中可以看出一底端倪。從Mashable的這篇報導中,更加讓人確信Google Map Traffic Data是使用Android用戶。

Data is gathered through third-party services and through information from Android users who have opted in to the My Location feature on Google Maps. Google would be able to tell, for instance, if there were several Android owners moving slowly on the freeway and determine that there was traffic slowing them down. The more people opting into the service in the area, the better the traffic information available will be.

 

三、Google Map Traffic會出現一些與現實路況不符的情形

根據觀察,Google Map交通時況在中研院門口附近於中午時候,常有塞車的情況,但事實是如此嗎? 想想中午的時候有許多人用“走”出去吃飯,如果Google Map交通時況是集合Android GPS訊號而轉換得到的資訊,這些被標示塞車的路段,可以合理的被懷疑是因為集合多數人”走”速度,而讓Google Map交通時況的判斷為塞車?

Screen shot 2013-05-10 at 1.41.21 PM
中午時,中研院附近的Google Map Traffic

 

Enhanced by Zemanta

[試作] WebGL在Geovisualization上應用

Google Earth是一個3D視覺化的地理空間資訊展示平台,無庸置疑的是它的提供高解析度衛星影像,且虛擬實境般的地理空間資訊瀏覽環境,令許多人愛不釋手,其實由NASA的World Wind也是一個相當不錯的3D視覺化的地理空間資訊展示平台,而且是open source。這二個平台都是獨立的平台,雖然Google Earth有整合在網頁瀏覽器中,對於一個本身就是3D視覺化的地理空間瀏覽器而言,要塞入另一個瀏覽器,總是卡卡的。所以有沒有輕量一點的、且原生於網頁技術的3D視覺化工具可以用來做地理空間資訊視覺化呢?

隨著網路技術的發展,應該會有許多工具可以用,但找到許多與WebGL相關的,所以先來看看WebGL可以做什麼事。

根據Wikipedia的介紹,WebGL (Web Graphics Library) 是一個用來顯示互動式3D和2D圖形的JavaScript API,不用plug-in就可以在網頁瀏覽器中使用。WebGL的元素(elements)可以鑲嵌於其它HTML元素,且組合成網頁中的一部份,也因為WebGL與網頁瀏覽器中GPU的標準相容,因此可以加速圖形處理能力。目前WebGL的設計和維護都是 Khronos Group 。

OpenWebGlobe 簡單地說,就是一個以WebGL做的Google Earth,可以套疊上高解析度的衛星影像、用DTM把地形撐起來、可疊上3D建物、POI和文字資訊等,功能十分完善,OpenWebGlobe是以MIT License 釋出的Open source,且提供SDK給開發者。

OpenWebGlobe
以WebGL為基礎的OpenWebGlobe

 

另外,也有相對輕量化的WebGL工具,讓網頁開發者可以用於網頁中地理空間資料的3D視覺化。WebGL Globe是Chrome的一項實驗計畫,其中有許多很Cool的demo,按照介紹就可以自已做出一個地理空間資料的3D視覺化。下圖是一個簡單的試作,利用NSAS MODIS衛星影像中所採集的地面溫度,經過一番資料的處理後,地面溫度的資料根據設定的顏色顯示於這個球上,可以旋轉、放大、縮小控制瀏覽。

WebGL Globe
以NASA MODIS地面溫度的WebGL Globe試作

WebGL Earth 是強調地圖或衛星影像的套疊,如套上BingMapOSM

WebGL Earth BingMap WebGL Earth OSM

Enhanced by Zemanta

2013-05-04 Open Data Meetup 一些心得 — 開放資料的目的是在於透明化

感謝Whisky號召讓大家在週末前來個Meetup,也感謝David提供場地準備點心零食。網路上的召集,昨天晚上聚集了來自各界的17個人的參與,MnO2快筆寫下這個meetup記錄,在這裡來分享一下個人的一些心得。

因應政府資料開放平台( data.gov.tw) 公測版的上線,這個meetup想讓大家聚在一起討論這個平台的問題,和未來對政府開放資料的期許。研考會似乎想知道和民眾期待的落差有多少? 但來這裡接收這些訊息的人是來自於凌網科技?我的困惑是凌網科技與研考會的關係為什麼要搞的如此的如膠似漆?可以做這個平台的廠商或NGO組織應該不少,凌網應該不是唯一吧!?但這個平台下一期仍然會由凌網得標? 有沒有人可以揭露一下為什麼凌網科技是研考會的唯一? 研考會為什麼選凌網科技來承包開放資料的平台的業務?廠商有什麼能力與資格才能承包這種業務?是不是很多人和我一樣想知道? 因為無「知」,請原諒我在談論中一直吐糟這位來自於凌網科技的朋友。

聚會中有不少人不認為在meetup中各自提出「政府應開放的10種資料」,政府的就會如實開放?我的反應很直接,以地籍資料而言,目前就是一個不可能的任務,因為這個資料是地方政府財源之一,對於開放的反對聲音會很大,內政部國土測繪中心若想開放還得有一段很長溝通過程。而許多與公部門交手過的與會者也多少了解基層的資料業務單位面對開放資料問題和困惑,若他們想談,許多資料使用者也願意溝通,而不只是一昧批判,因此重點在於能不能建立這樣的溝通機制?如英國政府資料開放平台(data.gov.uk)有data request 的功能,使用者若找不到可以利用data request來要資料,這個需求會被送到資料的業務單位,資料是否開放的處理過程和溝通皆公佈在平台上,其他對於這個資料有興趣的人就也可以知道處理清況,事實上,CfThellodata也在蒐集這樣的經驗。若這個資料的開放真的對於社會公益有幫助,在這樣公開的討論下,資料業務單位也會面臨極大的民眾輿論的壓力,回到地籍資料,若多數人覺得這是一件極需要開放的資料,如在Facebook上,大家都來按「讚」,地方政府也會感受壓力,我們的代議士們也才會感受「民氣」(選票),進而觀切,好啦,這個太理想了!?

開放資料社群也意識到這點,在做自已的「平台」表達開放資料的期許,展示對開放資料的處理能力,如零時政府的data.g0v.tw、經由網絡行動科技(Netivism)中譯且調校的CKAN,在青平台架起的台灣資料開放平台、 Cft再整理台北市政府的開放資料放在github上,從這裡長官們不難發現社群要的是什麼樣的平台和資料吧?!

總之,開放資料的目的是在於透明化,也就是人民有「知」的權利,無論平台,還是request的機制,都得在一個透明化過程進行。個人相當期盼有一個建全的開放資料平台,且該平台有資料request 的機制,提供民眾請求資料開放,且處理過程能透明化公開,再一次,好啦,這個太理想了!?

快篩「政府資料開放平台(公開測試版)」

一個開放資料平台是施政者用來證明政府開放程度的最佳方法之一,政府開放資料平台的成立是為了邁向透明化政府,讓人民看得到,而且「有感」! 因此透過人民使用政府所開放的資料,一方面,人民可了解政府施政、參與政府政策、甚至提出建言,使政府更有效率;另一方面,人民亦可利用政府所開放的資料,經由自己的創意與加值,從這之中獲利,政府即透過資料的開放而創造就業機會增加民間產值。

順應世界Open Data 潮流,研考會終於成立了「政府資料開放平台」(data.gov.tw),讓台灣達到Open Data的一個里程碑,恭禧! 但快速地瀏覽這個平台後,有「感」!感受到台灣政府對於透明化政府的害怕、抗拒與掙扎:

  • 過度本位主義的「政府資料開放平臺資料使用規範」。使用規範,或者說是該平台上的資料授權,主要是用來確保資料使用者在散佈、重製和改作該平台上資料時,不受智財權的限制;另一方面,政府釋出資料,恐怕因為有人用了這些開放資料後,造成財產或權益上受損,因此都會有免責聲明,這些都可以理解,但在使用規範中,聲明各機關可以停止提供資料,是一件值得商榷之事。政策改變而導致資料提供不符公共利益?我還想不出來有什麼樣的例子會有這樣的情況發生。而資料開放前,各機關就得清查所開放的資料是否涉及他人智財權、隱私和國防安全考量,怎麼會在開放後,因查覺到這些問題,才說不開放?這是為各機關不願意在開放前清查資料脫責?

六、開放資料停止提供 

有下列情形之一者,各機關得隨時停止全部或一部開放資料提供,使用者不得向本平臺管理機關及各機關請求任何賠償或補償:

(一) 因政策變更或其他正當事由,致各機關認為繼續提供資料供使用者加值使用,已不符合公共利益之要求者。

(二) 各機關開放之資料有侵害第三人智慧財產權、隱私權或其他法令疑慮

  • 重複開放、授權不一。「產銷履歷」為農委會項下的開放資料,是以CC 3.0-BY-SA方式釋出,但研考會把它再收入一次,但研考會的授權規範可以淩駕於CC授權?根據上述第6條,若政府因某些原因要停止開放產銷履歷,但早以CC釋出的資料是不能這樣被停止。
  • 人民不笨! 資料筆數多寡不會是用來評估平台的好壞的唯一指標,令人有感的資料才是符合人民期盼。當我看到「鐵路時刻表」和「客運時刻」時,著實地讓我倒抽一口氣,讓我驚訝政府透明的態度,時刻表還要開放嗎?本來就應該是開放的資料,難道在資料沒放上此平台前,交通部不允許火車時刻表被使用? 這只是多提供一個資料接口罷了!當然就不用說,資料提供只是為符合上級要求的各單位5項,因為教育部把大學、中學、小學、幼稚園的住址拆開,就有好幾個表,夠交差了!這樣的情形在台北市開放資料平台也有,OK認證也用產業別被拆成好幾個表,等著看吧!這種情形應該會不斷發生。
  • 沒有資料視覺化功能,當然就不可以有分析功能。目前Open Knowledge Foundation所建議的資料開放平台(CKAN),在資料上傳至平台後,可以將表格化的資料利用open source 的JavaScripts,將資料呈現,好驚訝!一個國家級的資料平台,是以這麼raw的資料呈現。
  • 資料編碼.地理座標格式不統一,增加使用者困擾。BIG 5 –> UTF8, TWD97TM2 –> WGS84 Lon/Lat