對於搜尋引擎來說,網頁內容重複是一個很大的問題。您可能覺得這是跟抄襲有關,可是實際上並非如此。最嚴重的問題所在,是不同的網址實際上是指向完全一樣的內容。舉例來說,以下的幾個網址可能都是同一個網頁,可是對搜尋引擎來說,它們卻是不同的網頁:
http://www.example-site.tw
http://example-site.tw
http://www.example-site.tw/index.php
如果搜尋引擎真的把以上的三個網址當成三個網頁來看的話,那對該網頁的排名是很不利的,因為可能有 20 個連接是連到第一個網址,50 個連接是連到第二個網址,30 個連接是連到第三個網址。因此,搜尋引擎會自己選其中一個網址來算排名 (因為完全一樣內容的網頁只有一頁會被排名),而會選上那一個則不一定。所以,對搜尋引擎來說,該網頁可能有 50 個連接,或是 30 個連接,或是,如果您運氣真的很不好的話,只有 20 個連接。如果搜尋引擎知道這三個網址其實都是 http://www.example-site.tw,那它們就可以知道說其實該網頁有 100 個反向連接。這樣該網頁的排名就會比較前面了。
最常見的網頁內容問題是網址前面有沒有 www. 的情況。在絕大部分的網站上,打入 http://www.[網站名] 和 http://[網站名] 會顯示出同一個網頁。那我們要如何讓搜尋引擎知道我們要用哪一個為基準呢?方法有好幾種。在這裡介紹一個算是最根本的辦法,那就是在 .htaccess 檔案中加入以下的內容 (在此以本站為例子) 來做 301 網址轉向 (301 redirect)。
RewriteEngine On
RewriteCond %{HTTP_HOST} ^seoland.tw [nc]
RewriteRule ^(.*)$ http://www.seoland.tw/$1 [r=301,nc]
(在使用這個例子時,記得用自己的網站名替換掉 seoland.tw。)
在以上的碼中,301 代表 301 網址轉向。301 網址轉向是所謂的『永遠轉向』。當搜尋引擎碰到這種轉換的時候,它就會知道就網址已經永遠搬到新網址,因此它會將與就網址有關的所有資訊轉移到新網址上。
這樣一來,若訪客打入 http://seoland.tw,網址會被轉換為 http://www.seoland.tw。搜尋引擎的蜘蛛程式 (spiders) 也會依循這個規則。因此,搜尋引擎就知道說本站首頁的標準網址 (canonical URL) 是 http://www.seoland.tw 了。

創作者介紹

深藍色流星

kaiser560 發表在 痞客邦 PIXNET 留言(0) 人氣()