Google Flu Trends 以台灣資料為例

Google 又有創舉!! Google Trends是一個追查使用者用闗鍵詞查詢的統計,之前我們都會覺得這些使用者的資訊是相當有用的市場資訊,如同超商或大賣場會把每月、每季的商品銷售做一統計,可以知道那些貨品在那些時間的購買率高,為防止顧客買不到,他們早早先儲貨等著,同樣的道理,全世界這麼多人用Google在搜尋,關鍵詞累積的量嚇人,而所能顯示的趨勢也相對的符合大眾的趨勢。
Google Flu Trends 即是將分析過去三年中,所有被使用且和感冒有關的關鍵詞,將這些詞的趨勢與CDC(美國疾病管理局)的資料作一對比,其結果相當驚人,Google Flu Trends所顯示的趨勢可以提早二個星期左右預測出感冒的人增加。

這個結果也發表在Nature上。paper在這裡。

google_flu_trend

跟著Google Flu Trend的做法,我也做了一同樣的試驗。我一樣從疾病管制局的網中下載了感冒和腸病毒的人數,並在手Google Trends查詢感冒和腸病毒的查詢次數,哇!! 雖然感冒的趨勢不是很一致,但腸病毒的趨勢相當接近,也有提前知道腸病毒爆發的趨勢。很神!! Google真的是愈來愈邪惡。


圖1: “感冒”關鍵詞在Google Trend的趨勢和台灣疾管局資料對比


圖2:”腸病毒”關鍵詞在Google Trend的趨勢和台灣疾管局資料對比

hakia,語意搜尋引擎

日前讀了一篇on-line magazine文章,介紹Semantic Search,文章內容一般,但文中介紹了一個新玩意,hakia,是一個語意搜尋引擎,予許使用者以一句語、一個片語或關鍵字來搜尋網頁。當然或你也和我一樣,也用習慣了google search,對於它強大的search,感到讚嘆不已,然而googele search充只量的是以關鍵字的方式來找網頁,hakia 則是一個 semantic web engine。hakia 之中一定包含有一個斷詞系統,來判斷句子結構,並以fuzzy來分析句子中字的重要性,之後再根據己建立的ontology來判斷字和字的關係,以便於找到更符合問題的答案。例如,我問了 where is the popular place to visit?

hakia 的回答不僅找到是網頁中符合這句話中的文字而已,而是判斷出visit最重要,然後popular、place次之。

除了符合這幾個字的網頁會被找到,根據語義的ontology,與這些詞相關的也會被找出來,換句話說,和這句話意思接近的網頁都會被找出來。

哇,最近一直在想如何將地名的語意建立起來,以供查詢查時,能更加準確地或更直覺地提供查詢結果。看來我的想法是沒有錯的。

古今地圖疊合,時空交錯一瞬間

中研院GIS小組與遠流出版社合作,將100多年前日本人所繪製的台灣堡圖,透過Google Map當成平台發佈。右今地圖的疊合,使人一瞬間的錯覺,從現今重回100年前。我特別取了一個我家附近的快照(snapshot),我家在草屯,舊名草鞋墩,由來據傳是當時鄭成功大軍要進入埔里之前在此休憩,因長途拔涉至此,許多人的草鞋,都已經磨損,而在此地換新鞋,而大量換鞋之後,舊鞋堆積如山,使得「草鞋墩」一名不徑而走。然而,科學一點的考究,不難發現,草屯位於埔里盆地出口的沖積平原,對外連結台中盆地、彰化平原,而對內連結埔里盆地和中央山脈西麓,在三百年前即是東西往來的重要交通節點,自然而然地這個地方就成為一個驛站,會有許多人在此休息,以便進入山地,或出走平原,在這個地方換鞋,也很正常,我相信草鞋被這樣給堆起來,應該也很正常。
更仔細一點說,我家的舊地名為「崎仔頭」,意指在緩坡之頭,事實上,在我小時候,我家門口的那一條路是二個大曬稻場,也是許多人的活動空間,我家在20年前還是田地。如今,都市化的結果,房屋不斷往外擴張,以前庒頭和庒頭的不同與對抗,己經在都市化擴張下,不是重新規劃,就是連結在一起,庒頭的地方意識、地方感也隨之消失。現在若有人問我,「你住草屯那裡?」,若我回答崎仔頭,他也知道,表示他的年紀超過30歲以上。
地名的變遷,猶如空間的消逝,現在只存在地圖中了!!

台灣堡圖在Google Map

Open Street Map: 一個草根性的地圖再製運動

Open Street Map

Tim Barner-Lee將OpenStreetMap喻為”grassroots remapping of the world”,顧明思義,OSM是一個由一般人自發而起的製圖運動,這是一個革命嗎?我認為是一個地圖的革命!!Steven Coast,OSM的發起人,認為地理資料應用是免費的,國家單位製圖單位(Ordnance Survey)所沒道理拿著納稅人的錢所製作出來的地圖和地理資料,人民需要使用還得付大筆銀子(一個鄉鎮買£30,000, 整個國家的話得花£4,099,000)(ref),在英國和其它大多數國家一樣,地圖或地理資料都是政府單位製怍,而當民眾要使用時,政府也同樣會索取不少費用,而反觀美國是將政府部門所生產的大多數資料公開釋放,使得一般民眾皆可輕鬆的獲得,在這樣的氛圍下,Steven Coast希望在英國也有這樣的免費的地理資料可隨手可得,因此興起這樣的一個運動。這個計畫主要希望每個人帶著GPS藉由跑步、騎腳踏車、開車..任何在空間中移動的活動將航跡(traces)記錄下來,並且上傳至OSMWiki上,再透過群眾共同創建的力量,檢核地圖、生產地圖、最後使得每個人都可以免費的使用這個地圖。這種眾人製圖活動恐怕是傳統地理學者或製圖學者無法想像的,地圖象徵的一種空間的權力,對於所在的權力宣示與標記,始料未及的是地圖可以透過一般人民眾來生產製作。