Archive for 二月, 2007

搜尋引擎小記事 Part2

星期二, 二月 27th, 2007

query後接下來就是要把連貫的字讓他在文章中連結起來… 找出預覽點, 然後把使用者要的搜尋字串標上不一樣的顏色
像:
====2只要是使用自由軟體來做事====

b:只要是 0:3 b:使用 3:5 b:自由 5:7 b:軟體 7:9 a:體來 8:10 a:來做 9:11 b:做事 10:12

就會出類似這樣的code.

為第一個詞或bigram再文章中出現的位址x1.y1第二個為x2.y2….etc
然後要做出.
for word in content place
if x2 == y1 or x2 == (y1-1):

new_target_is(x1-y2)
的效果, 把整篇文章分析出來.

這讓我邏輯爆炸了一個多小時… Orz

全部處理完之後發現到我老闆的筆頭禪…
筆頭禪

搜尋引擎小記事

星期日, 二月 25th, 2007

Query已經完成了. 雖然可能會有效能上的疑慮. 不過聽從那位三個孩子的媽媽, Anna Patterson的意見. 先寫出會動的. 再把你能加強改良的東西放進去.

接下來是interface, 我大概已經想過要怎麼處理了. 不過還是多想兩天好了. 反正這個搜尋引擎系統也寫了好一陣子了.

會面對的問題就是在於文章內的取樣標準與取樣方法. 預覽的100個字重點在於要讓使用者了解這頁網頁是否是他們所需要的. 如何找出關鍵字, 如何判斷文章內某一段具有關鍵字的內容重要性高過其他具有關鍵字的內容.
Query