Google 由兩名在史丹福大學的博士生佩吉 (Larry Page) 和布林 (Sergey Brin) 開始。他們帶來了一個給網頁評估的新概念。這個概念, 稱網頁級別 (PageRank), 是從Google 演算法[1]重要的開端 。網頁級別十分倚賴導入鏈結 (incoming link) ,並利用這種每個導入某網頁的鏈結相當於給該網頁價值投一票的理論建立起邏輯系統。越多導入鏈結意味著該網頁越有「價值」。而每個導入鏈結本身價值直接根據該鏈結從何而來的網頁級別,以及相反的該頁導出鏈結 (outgoing link) 。
在網頁級別幫助下,Google 在服務相關的結果上證明它相當優異。Google 成為了最普遍和最成功的搜索引擎。由於網頁級別度量了站點外因子, Google 感到它會比頁內因子難以動手腳。
然而道高一呎魔高一丈。網站員們已經開發出對付Inktomi 搜索引擎的鏈結操作工具和計劃。這些方法證明對Google 演算法一樣管用。許多站集中於交換、買賣大量鏈接。隨著『網站員尋求獲取鏈結只單單要影響Google送更多流量給該站,而不管是否對站點訪客有用否』這種行為增加,網頁級別對原始演算法的信賴度漸漸被破壞了。
此時,是Google 和其它查尋引擎對廣大範圍的站外因子仔細檢視的時候。開發更加聰明的演算法有其他原因。網際網路已經膨脹到擁有非技術的廣大族群。他們經常無法使用先進的提問技術來取得資訊;而且他們得面對比起發展早期更龐大資料、更複雜的索引。搜尋引擎必須開發具備預測性、語義性、語言性和啟發性演算法。
kaiser560 發表在 痞客邦 留言(0) 人氣(23)
一個有放廣告的網站,必須時常注意各個廣告收益的情況,並對廣告顯現頻率作出適當的調適。如果只有一兩個廣告,要知道哪一個廣告的收益比較好是很容易的。可是,如果你有 10 個、20 個、甚至更多個廣告的話,那要算出哪一個廣告該顯示比較多次才能帶來更多的收入就不是件容易的事,尤其是當不同廣告的價錢有不同的算法時。在這裡講的獲利,不是廣告的收益總額,而是平均廣告顯現一次能夠帶來多少收入。如果一個廣告總共顯現了 10 次,而帶來了 $100 的收益,那這很明顯地比一個要顯現 10,000 次才能帶來 $1,000 收益的廣告好很多。
知道每個廣告顯現一次可以有多少收入後,你就能夠依照這些資訊來盡量多顯示高收入的廣告,而減少低收入廣告顯現的次數 (當然,影響廣告收入還有其他許多因素,如廣告放的位置及廣告放的網站內容等等,不過那些考量在本文章的範圍外)。老貓在這裡跟大家討論一下如何算出哪個廣告獲利最高。
第一就是要先了解廣告費用的計算方式。基本上,這不外乎為以下三種:
CPM:Cost Per Impression。這是以廣告出現次數來計費。不管訪客有沒有點選這個廣告。所以,廣告出現次數越多,網站的收入也越高。大部分的大型網站在賣廣告時,都是以這種方式來計費。Impression 的基本單位跟台灣的股票一樣是千。CPM = $5 的意思是,該廣告每顯現一千次的價錢為 $5。
kaiser560 發表在 痞客邦 留言(0) 人氣(51)
自己網站的流量,可以靠許多方式獲得蠻精準的資料,像是 Google Analytics。可是,別的網站,尤其是競爭者的網站,的流量是如何呢?這是個很難回答的問題,因為對手不會告訴妳他的流量,就像妳不會告訴對手妳的流量一樣。
那這樣怎麼辦呢?最好的方式,就是透過幾個第三者的流量調查來分析。以下是 9 個這一類的網站,依照流量調查方式、費用 (免費或收費)、以及有沒有涵蓋台灣市場的流量列出。
kaiser560 發表在 痞客邦 留言(0) 人氣(65)
對於搜尋引擎來說,網頁內容重複是一個很大的問題。您可能覺得這是跟抄襲有關,可是實際上並非如此。最嚴重的問題所在,是不同的網址實際上是指向完全一樣的內容。舉例來說,以下的幾個網址可能都是同一個網頁,可是對搜尋引擎來說,它們卻是不同的網頁:
http://www.example-site.tw
http://example-site.tw
http://www.example-site.tw/index.php
如果搜尋引擎真的把以上的三個網址當成三個網頁來看的話,那對該網頁的排名是很不利的,因為可能有 20 個連接是連到第一個網址,50 個連接是連到第二個網址,30 個連接是連到第三個網址。因此,搜尋引擎會自己選其中一個網址來算排名 (因為完全一樣內容的網頁只有一頁會被排名),而會選上那一個則不一定。所以,對搜尋引擎來說,該網頁可能有 50 個連接,或是 30 個連接,或是,如果您運氣真的很不好的話,只有 20 個連接。如果搜尋引擎知道這三個網址其實都是 http://www.example-site.tw,那它們就可以知道說其實該網頁有 100 個反向連接。這樣該網頁的排名就會比較前面了。
最常見的網頁內容問題是網址前面有沒有 www. 的情況。在絕大部分的網站上,打入 http://www.[網站名] 和 http://[網站名] 會顯示出同一個網頁。那我們要如何讓搜尋引擎知道我們要用哪一個為基準呢?方法有好幾種。在這裡介紹一個算是最根本的辦法,那就是在 .htaccess 檔案中加入以下的內容 (在此以本站為例子) 來做 301 網址轉向 (301 redirect)。
RewriteEngine On
RewriteCond %{HTTP_HOST} ^seoland.tw [nc]
RewriteRule ^(.*)$ http://www.seoland.tw/$1 [r=301,nc]
(在使用這個例子時,記得用自己的網站名替換掉 seoland.tw。)
在以上的碼中,301 代表 301 網址轉向。301 網址轉向是所謂的『永遠轉向』。當搜尋引擎碰到這種轉換的時候,它就會知道就網址已經永遠搬到新網址,因此它會將與就網址有關的所有資訊轉移到新網址上。
這樣一來,若訪客打入 http://seoland.tw,網址會被轉換為 http://www.seoland.tw。搜尋引擎的蜘蛛程式 (spiders) 也會依循這個規則。因此,搜尋引擎就知道說本站首頁的標準網址 (canonical URL) 是 http://www.seoland.tw 了。
kaiser560 發表在 痞客邦 留言(0) 人氣(122)
就以上的例子來說,如果那 5 個 nofollow 的連接不復存在於網頁 A 的話,那剩下的 5 個連接每一個就有可以獲得 2 分 Pagerank,而不再只是 1 分了。如果你以後想要有效控制網站內不同網頁的 Pagerank 值,最佳的做法就是好好考慮貴站的站內連接方式。老貓給站長的建議是,除非你的網站在許多地方現在已經在用 nofollow 來控制 Pagerank 的分配,那你沒有必要做任何改變。在 SEO 部落格中,唯一有被加上 nofollow 的站內連接是指向『隱私權政策』,所以 Google 的這個改變對本站來說可以說完全沒有影響。
不過,在歐美各地,現在談到 SEO 都是以能否在 Google 排名上有用為基準,鮮少有人在探討別的搜尋引擎。當然,這並不代表說那種做法對提升 Yahoo 或是 MSN (Bing) 的排名沒有幫助。如果這是真的,那麼那些堅持用 nofollow 來做 Pagerank 塑造有用的 SEO 就很丟臉了,因為這代表那樣做至少在這一年內對提升 Google 上的排名完全沒有作用。Matt Cutts 說 Google 用這種方式已經有一年的時間。
所以,照現在 Google 的算法,用 nofollow 來塑造 Pagerank 是沒有用的。如果那個連接是 nofollow 的話,那 1 分就消失了。換言之,Google 的算法是,10 分 / 10 個連接 = 1 個連接理論上分配到1 分。可是,根據 Matt Cutts 的說法,現在 Google 的算法是,如果 10 個連接中有 5 個是 nofollow,那有 nofollow 的連接仍然是沒有獲得任何 Pagerank,可是剩餘的 5 個連接,每一個都只獲得 1 分。這也就是 Pagerank 塑造的基本道理,因為如此一來站長就可以透過 nofollow 來控制哪個網頁可以獲取比較多的 Pagerank。Google 以往的做法是,如果那 10 個連接中有 5 個是 nofollow,那該 5 個連接就沒有分配到任何 Pagerank,而其餘的 5 個連接每一個將可以分到 2 分。如果沒有任何一個連接是 nofollow 的話,那每一個連接將可以分到 1 分。假設網頁 A 有 10 個連接,而該網頁同時有 10 個 Pagerank 分。老貓以下來解釋一下:這在 SEO 業界投下了一個震撼彈,因為 Google 的處理方式代表用 nofollow 來做 Pagerank 塑造不再是一個可行的方式。在這個月初,Google 的 Matt Cutts 講了 Google 如何處理 Pagerank 的分配,兩天前他也在自己的部落格上寫了一篇有關 pagerank sculpting 的文章。
當時我的立場是,這種做法不會是壞事,不過在對搜尋引擎排名的幫助上,Pagerank sculpting 的重要性遠不一些基本的要素。我在兩年前有討論用 nofollow 來分配 Pagerank 值的做法,而一年前我也有提到Pagerank 塑造的觀念。有的人發誓這種做法有幫助排名,也有的人覺得這種做法是沒有意義的。在 SEO 業界,並沒有一定的結論。主要的討論,都是著重在是不是可以透過 nofollow 來控制在一個網站內哪些網頁能夠獲取比較高的 Pagerank (這樣可以幫助那些網頁在搜尋引擎上的排名)。在最近這兩年,Pagerank 塑造 (Pagerank Scultping) 是一個熱門的話題。
kaiser560 發表在 痞客邦 留言(0) 人氣(20)
這個想法是雅虎的工程師提出的,目的是讓本來既有的 sitemap 協定更有效運用。雅虎將這個想法與其他搜尋引擎討論,並且獲得支持。網站管理者仍然可以透過舊有的推薦模式,主動在各搜尋引擎上提供搜尋引擎 sitemap 的位置。
對搜尋引擎而言,對比起從首頁進入尋找,Sitemap 可以讓搜尋引擎更有效簡易的紀錄、更新、收錄網站的頁面。雖然如此,沒有一個搜尋引擎準備放棄從首頁進行搜尋紀錄網頁的行為,Sitemap 的角色可以輔助讓搜尋更有效率。這個新的協定將 Robot.txt 跟 Sitemap 兩者更緊密的聯合起來,協助搜尋引擎收錄網站的頁面。Robot.txt 是一個純文字檔案,過去 Robot.txt 是負責告訴搜尋引擎不要收錄哪些頁面,而 Sitemap 則是個利用 XML 語言編寫的檔案,負責告訴搜尋引擎可以收錄哪些頁面,而且更可以告訴搜尋引擎更多關於每一頁的特性。Sitemap 可以說更進一步加強 Robot.txt 的功能。
語法範例:Sitemap: http://www.你的網址.com/sitemap.xml 負責搜尋的機械人在進入網站的時候會首先閱讀 robot.txt 這個檔案,再根據這檔案提供的位置收錄 sitemap 的檔案。除此之外,更聯合宣布了 sitemap 聯盟 將支援 Sitemap 自動搜尋的功能。過去網站的行銷人員都要將這些 sitemap 個別提交給各搜尋引擎,現在只要在 Robot.txt 這個檔案加入一段簡單的語法就可以通知所有的搜尋引擎 sitemap 的 xml 檔案放置在甚麼地方。在紐約的搜尋引擎戰略大會中宣布 Ask.com 加入了這個協定。搜尋引擎的老大們 Yahoo、MSN、Google 宣布他們將聯手推出共同的 sitemap 協定。
kaiser560 發表在 痞客邦 留言(0) 人氣(210)