|
作者是 Administrator
|
|
週五, 26 二月 2010 10:32 |
|
“搜索引擎”(SE)經常被誤導同時來形容人工目錄和真正的搜索引擎。事實上,他們是完全不相同的,最主要的不同處就是在於搜尋的結果是如何產生的。
現在這個市場上有四種主要的不同搜索引擎類型。它們是:
- 爬行式搜索引擎 (Crawler based);
- 人工目錄搜索引擎 (Directories);
- 匯總式搜索引擎 (META engines);
- 點擊付費 (Pay-for-performance or Paid inclusion)。
爬行式的SE也稱為蜘蛛或網路爬蟲,這是一種特殊的軟體會自動的定期訪問各個網站,它會將爬行所搜集來的資料儲存在它巨大的資料庫中。谷歌(www.google.com) 就是一個爬行式搜索引擎的最好示範。
這種特殊的軟體被稱為“機器人- bot, robot” ,”蜘蛛 - spider“,或”爬蟲 -crawler“。他們會先瀏覽已存在搜索引擎資料庫中被索引的網頁,並從這些網頁的連結中爬行到其他的網站。除此之外,在您提交網頁到搜索引擎之後,這些網頁會排隊等著蜘蛛或機器人的掃描。 一旦它們發現您的網頁後,它們會通過 HTTP去瀏覽您的網頁(這過程就像您要去別的網站一樣,會在瀏覽器上地址欄輸入您要去的網址)。
凡走過必留痕跡,蜘蛛會在您的伺服器上留下造訪的記錄。因此,您可以從伺服器的日誌上發現到搜索引擎何時造訪過您的網站。當它們造訪您的網站時,您的伺服器會將網頁的HTML原始檔傳送給它們。蜘蛛讀取這些HTML原檔的這個過程被稱為爬行 “crawling” 或 “spidering”。
雖然人類訪客懂得欣賞您網頁漂亮的圖形和令人印象深刻動畫,但蜘蛛不瞭解這是什麼東西,更看不到。人類通常不會去看META標記,但蜘蛛絕對會。人類通常會注意版面上最大和最有吸引力的文字。對蜘蛛來說,它們著重在最接近網頁的開始和結束時文字的部分,或是被連結包含的文字。這就是人類與軟體在觀看網站時之間的不同了
你花了大把的金錢與時間建立了一個酷站,嵌入大量的Flash動畫和 JavaScript的 技巧。然而,搜索引擎蜘蛛是一個機器人,它們一看到<SCRIPT>的標籤,就會跳過它。所以搜索引擎根本看不到在中間的內容。結果呢?您網頁的排名超低,更沒人能從搜索引擎找到它。
SEO(搜索引擎優化)就是一個根本的解決方案,優化能使您的網頁成為搜索引擎友好的網頁。搜索引擎優化的目地主要是對抗爬行式的搜索引擎,爬行式的搜索引擎是目前在網際網路上最流行的引擎。不必為了搜索引擎優化而抹滅了您的創造力,我們會教導您如何正確地使用您的創造力,並完全的結合網路優化的需求。
讓我們再來談談蜘蛛的工作方式。它在讀取您的網頁後,他們會以壓縮的方式,將您的網頁存儲在一個巨大的資料庫中,這個過程我們稱為搜索引擎索引。搜索引擎將這些數據存儲在搜索引擎索引中,因此,當有人在網路查詢時,搜索引擎可以快速的找到相關的資料,再將這些資料列入在搜尋結果頁上,而這個過程則被稱為索引 - “indexing “。
當搜索引擎將查詢的資料列在搜尋結果頁面的同時,搜索引擎會透過複雜的分析技術,評估您網頁的相關性,而將網頁安插在不同的搜尋結果頁面。許多 On-Page 和 Off-Page 的因素也會影響網頁在結果頁面的順序。此過程稱為排名,或稱為 “Ranking“。當爬行式的搜索引擎索引您的網頁之後,它會定期地再次訪問您的網站,來查看您的網頁是否有任何的更新。新的改變將會再次的影響您網站在搜尋結果頁的順序。
人工目錄 (Directories) 則是不同的。使用者完全是透過人工的方式將網頁提交給它們。為了要防止自動提交,這類的人工目錄會使用 CAPTCHA 來過濾自動提交的濫用。在完成人工提交程序後,您的網址將排隊等者真人的編輯來審查您的網頁。當真人編輯閱讀過您的網站之後,他們會作出接受或拒絕您網頁的決定。
大多數人工目錄不會有自己的排名機制 - 他們會使用像是字母順序或谷歌的 PageRank 來排名。所以說,提交確切的網站訊息及正確的目錄給人工編輯是非常重要的。 搜索引擎的蜘蛛常常使用人工目錄作為新網頁抓取的來源。不言而喻的,你應該非常仔細地進行人工目錄的提交。當您提交您網站給人工目錄的時候,您會輸入一個簡短的網站說明給編輯。所以當網路使用者搜尋人工目錄的時候,只要這些搜尋描述類似您的網站時,您的網站將被列在清單上,而網站的更新並不會像爬行式的搜索引擎有任何的影響力了。
人工目錄的創建通常是由經驗豐富的編輯們來執行的,以產生更好的的過濾結果。最有名的和最重要的人工目錄就是雅虎(www.yahoo.com)和DMOZ(www.dmoz.org)了。
複合式搜索引擎 (Hybrid Engines)。 有些引擎甚至於還與人工目錄相結合。例如雅虎(www.yahoo.com)和谷歌(www.google.com),儘管這裡所說的例子一個是人工目錄,另一個是爬行式搜索引擎,但其實它們是當今最重要的複合式搜索引擎。
匯總式搜索引擎 (META Engines)。 另外一種搜尋網際網路的方法是同時搜尋不同的搜索引擎,再將這些從不同搜索引擎收集來的結果相結合,最後,再將結果列在他們的結果頁上。這種搜尋的類型提供了非常有效的方式,可以讓使用者搜尋大量的資料。像是 MetaCrawler(www.metacrawler.com) 和 Dogpile的(www.dogpile.com)就是匯總式搜索引擎最好的例子。MetaCrawler會從七個最暢銷的搜索引擎(包括 AltaVista 和 Lycos)中幫您找到資料。
按業績付費和付費收錄引擎 (Pay-For-Performance and Paid Inclusion)。 從字面上的意思您就可以知道,這些搜索引擎會要求您付一筆費用(無論是定期支付或是一次付清),以保證您的網站會列在它們搜尋結果頁,保證它們索引您的網站,或是保證會根據您所選擇的關鍵字來排名。只有極少數的搜索引擎是只專注在付費列表(Paid-listing)。然而,主要的搜索引擎大多數都有提供付費列表的服務,來作其索引和排名系統的選擇。
不像是付費收錄,只需付費就會被列入搜尋結果頁,並保證您的網頁會在特定的搜尋條件中出現,您出的價越高,您排名的位置就會越高。付費排名列表通常可以從搜索引擎網路中所買到。這種搜索引擎網路通常是以競標關鍵字或詞組的方式來進行的,所需的費用叫做點擊成本(Cost-Per-Click: CPC)。而這整個過程則被稱為點擊付費(Pay-Per-Click: PPC)。雅虎和谷歌是最大付費列表的供應商,Live搜索引擎也有出售付費排名列表的服務。
|
|
最近更新在 週二, 02 三月 2010 09:09 |