hakia,語意搜尋引擎
日前讀了一篇on-line magazine文章,介紹Semantic Search,文章內容一般,但文中介紹了一個新玩意,hakia,是一個語意搜尋引擎,予許使用者以一句語、一個片語或關鍵字來搜尋網頁。當然或你也和我一樣,也用習慣了google search,對於它強大的search,感到讚嘆不已,然而googele search充只量的是以關鍵字的方式來找網頁,hakia 則是一個 semantic web engine。hakia 之中一定包含有一個斷詞系統,來判斷句子結構,並以fuzzy來分析句子中字的重要性,之後再根據己建立的ontology來判斷字和字的關係,以便於找到更符合問題的答案。例如,我問了 where is the popular place to visit?

hakia 的回答不僅找到是網頁中符合這句話中的文字而已,而是判斷出visit最重要,然後popular、place次之。

除了符合這幾個字的網頁會被找到,根據語義的ontology,與這些詞相關的也會被找出來,換句話說,和這句話意思接近的網頁都會被找出來。
哇,最近一直在想如何將地名的語意建立起來,以供查詢查時,能更加準確地或更直覺地提供查詢結果。看來我的想法是沒有錯的。
Posted: July 17th, 2008 under 學術, 語意網.
Tags: 語意, web, 本體
Comments
Comment from Dongpo
Time July 18, 2008 at 3:23 pm
Fei,你說的對!
hell的確無法被判斷為語助詞,但這句話並不是一個official句子!!
============================================
Ontological Semantics Resources for : hell
(hell-n1
(cat n)
(synonyms “hades, perdition, netherworld, the-netherworld”)
(anno(def “the state or place of total separation from divine guidance and so of eternal misery and suffering”)(comments “”)(ex “”))
(syn-struc((root $var0)(cat n)))
(sem-struc(hell))
)
============================================
雖然我不知道你想從網路中,得到什麼答案! ^_^!
但前置的Fuzzy分析結果,ITC被為是最重要。這點令人興奮!!
============================================
Fuzzy Logic approximation of words with search importance weights -
where [SP] = Stop symbol, weight=00
the [Z1] = Immaterial, weight=00
hell [V2] = Event, weight=50
is [Z1] = Immaterial, weight=00
itc [SM] = Special Word, weight=80
============================================





Comment from fei
Time July 18, 2008 at 7:19 am
哈哈,我试了试”where the hell is ITC”, 发现它把“where”替换成了“location”进行搜索。可是它把“hell”也看作关键词而不是语气助词了 :)