我們先來聊下搜索引擎研究,搜索引擎研究算法的文章我想大家也都在網(wǎng)上或者其它地方看過不少吧,我個(gè)人覺得那些深層次的就不用去研究了,畢竟我們不是專業(yè)做搜索引擎的,呵呵。下面就搜索引擎算法我談一些個(gè)人認(rèn)識。
搜索引擎最主要的解決問題在于,如何有效快速地抓取互聯(lián)網(wǎng)的信息而不被無休止的重復(fù)鏈接,錯(cuò)誤鏈接,及循環(huán)程序所困撓,并分類有序地存儲入庫。其次,就是要符合用戶體,給搜索用戶帶來親密感。反制垃圾SEO的干擾,就是搜索引擎最頭痛的問題所在。
如果大家只是做一個(gè)關(guān)鍵詞排名,抓取程序大可不必深究,因?yàn)橐阅壳八阉饕鎻?qiáng)大的索引能力,讓搜索引擎索引一個(gè)新站,那可是輕而易舉的事情。搜索引擎基本上是按照域名的重要性決定收錄網(wǎng)頁數(shù)量,百度的算法和GOOGLE的有些區(qū)別,百度在收錄網(wǎng)頁數(shù)量不足的情況下將會(huì)非常努力的遍歷網(wǎng)站的鏈接更深處,但GOOGLE對于動(dòng)態(tài)網(wǎng)站則只會(huì)遍歷一定的鏈接層次,這個(gè)層次是多少,網(wǎng)上有很多種說法。所以需要我們制作網(wǎng)站地圖。
對于搜索引擎反作弊的手段,SEO也必須多多少少心里有桿秤吧,其實(shí)所有的SEO都是在人工干涉排名的。我們可以假設(shè)一下,如果沒有seo干涉,一個(gè)競爭激烈的關(guān)鍵詞排名會(huì)是怎么樣的呢?
第一、他的相關(guān)性肯定非常強(qiáng);第二、內(nèi)容豐富,更新平凡;第三、非常有權(quán)威。
但是如果加入seo元素就變了,那就是:關(guān)鍵詞密度、內(nèi)部結(jié)構(gòu)等因數(shù)都要非常合適,幾乎所有頁均被搜索引擎收錄,反向連接非常豐富,并確是非常自然的連接,連接種類也很多。
以上就可以看出我們做seo的工作重點(diǎn)在哪里了,那就是,使網(wǎng)站的關(guān)鍵詞突出,內(nèi)容豐富,使網(wǎng)站結(jié)構(gòu)合理,層次經(jīng)可能的少些,擁有大量的反向連接并確盡可能的廣泛分布。
下面我們來講解關(guān)鍵詞。
關(guān)鍵詞包括:關(guān)鍵詞的位置,關(guān)鍵詞的密度,標(biāo)簽對關(guān)鍵詞的作用。
在seo文章中對關(guān)鍵詞的位置和密度講解的最多,這里我就不詳細(xì)講解了。主要是《title》《alt》之類的標(biāo)簽,文章的開頭、段落的開頭都要用到此類,其中《title》中和超鏈接中的文字對提升關(guān)鍵詞的相關(guān)性尤為重要。搜索對于關(guān)鍵詞的密度要求其實(shí)很松的,并不是某些人說的百分之五,或是百分之二十以內(nèi),只要不是惡意重復(fù),自然一點(diǎn)就OK。諸如加粗加大的特殊標(biāo)簽,對加強(qiáng)一篇文檔與被著重的關(guān)鍵詞相關(guān)性,作用也很明顯。但是在需要優(yōu)化的關(guān)鍵詞數(shù)量非常多的情況下,如何控制好特殊標(biāo)簽,從而使多篇文檔融合為一個(gè)有機(jī)互益的整體,就非常值得研究一下了。至于《h1》,《h2》,《h3》和《strong》標(biāo)簽,下面我會(huì)說到。
但是過份的使用標(biāo)簽,那就是關(guān)鍵詞作弊了。那樣搜索引擎就會(huì)K你了,呵呵。
講關(guān)鍵詞必然會(huì)談到鏈接,鏈接是一個(gè)網(wǎng)站在搜索引擎中表現(xiàn)的籌碼。在搜索引擎的搜索結(jié)果中存在著不相關(guān)內(nèi)容會(huì)影響搜索引擎的功能性,而不按重要性無序排列的結(jié)果,將帶給用戶極壞的用戶體驗(yàn)。
然而在搜索引擎算法中,重要性是如何體現(xiàn)的呢?顯然,只有鏈接。這里我們說的鏈接指的是外部鏈接?;ヂ?lián)網(wǎng)是靠超鏈接互相聯(lián)系起來的,不管是百度的鏈接分析算法,還是GOOGLE的PR算法,他們始終是圍繞以下幾點(diǎn):1.鏈接的數(shù)量;2.鏈接的質(zhì)量;3.鏈接的來源;4.鏈接文本;5.SPAN鏈接。
鏈接的數(shù)量,這個(gè)大家都很容易理解,我不必多說了。
鏈接的質(zhì)量,網(wǎng)絡(luò)上有很多種說法,各搜索引擎角度也不一。GOOGLE的高質(zhì)量鏈接是以給出鏈接的這個(gè)頁面在搜索引擎中的重要性較高。如果一個(gè)權(quán)重高的站給你做了鏈接,這個(gè)時(shí)候這個(gè)鏈接就是一個(gè)很高質(zhì)量的連接,而百度更加看重首頁鏈接。對百度而言,內(nèi)頁的連接質(zhì)量永遠(yuǎn)比首頁要低。當(dāng)然,網(wǎng)站權(quán)重的高低也是一方面的。
這里我要重點(diǎn)想說的是SPAN鏈接。我想大家對SPAN鏈接應(yīng)該都很熟悉吧,總結(jié)來說,SPAN鏈接是指用鏈接進(jìn)行作弊,手段主要有,留言本span,BLOG span,Wiki span,以及Link Factory(連接工廠)。各搜索引擎之間差異最大的可能就是針對span的解決部分了,GOOGLE對于留言本群發(fā)之類的SPAN采用補(bǔ)充材料降權(quán)、不作處理的方式處理SPAN,對于Link Factory采用徹底封殺處理,這樣也導(dǎo)致一些網(wǎng)址導(dǎo)航站被無故封殺,這也是搜索機(jī)制存在的問題。
百度我們都很了解,稱為本土化的搜索引擎。我們談到百度最多的也就是百度的人工干涉。百度封殺SPAN可能采用程序和人工干涉相結(jié)果的辦法。先通過機(jī)制算法將問題連接頁面添加到數(shù)據(jù)庫,再由工作人員人工審核。從某種意義上來說,鏈接的來源和鏈接文本屬于相關(guān)性研究的范疇。鏈接作弊和關(guān)鍵字作弊屬于搜索引擎反作弊算法研究范疇。他們都可以算做是鏈接質(zhì)量的一部分。
下面我們來分析不同搜索引擎的細(xì)微區(qū)別。
在一個(gè)網(wǎng)站的SEO過程中,最好是要兼顧多數(shù)搜索引擎的習(xí)慣。但在某些竟?fàn)幜ο喈?dāng)大的關(guān)鍵詞SEO中,有針對性的SEO行為也是非常有意義的。所以研究分析不同搜索引擎之間的區(qū)別,也是很有必要的。這里我們就對百度,GOOGLE,YAHOO之間區(qū)別進(jìn)行說明。百度是中文用戶市場份額最大的一個(gè),但是百度的竟價(jià)排名,使大多數(shù)SEO都不注重百度的SEO,我想大家也是這樣的吧。GOOGLE是SEO們奮斗的焦點(diǎn),而YAHOO最近一段時(shí)間則默默無聞,由于YAHOO和GOOGLE的相似程度比較高,所以GOOGLE SEOER們喜歡YAHOO,也比喜歡百度多一些。GOOGLE和YAHOO的區(qū)別在與,Google注重語義分析和鏈接,Yahoo注重title和外部鏈接。Google和Yahoo更新很快,蜘蛛很勤勞,由于只要把頁面本身優(yōu)化好,就能在Yahoo中取得很好的排名,而這些頁面優(yōu)化都是自己可以控制的,所以說Yahoo優(yōu)化比Google優(yōu)化更容易,所用時(shí)間更短。
特別是對于熱門關(guān)鍵詞,兩者的區(qū)別非常明顯。從另一個(gè)角度來說,能把Google優(yōu)化好的人不一定水平有多高,可能只不過是手頭有較多的鏈接資源可以利用,要是服務(wù)期過了,把指向你的鏈接一撤,你的排名就會(huì)掉下來。但是你能把Yahoo優(yōu)化好,說明你的網(wǎng)頁優(yōu)化本身是好的,你的排名基礎(chǔ)是扎實(shí)的,你的優(yōu)化工作做的很到位、很牛、很好很強(qiáng)大。特別強(qiáng)調(diào)一下Google的強(qiáng)大的語義分析能力,很多人說搜索引擎看不懂語義,這其實(shí)是錯(cuò)的。我們做連接時(shí),將關(guān)鍵詞和諧的組織到一個(gè)語句里,再進(jìn)行關(guān)鍵詞連接優(yōu)化,這樣的效果遠(yuǎn)遠(yuǎn)高于你單做一個(gè)詞的效果。在Google中搜“seo入門”, 結(jié)果你會(huì)發(fā)現(xiàn)“seo基礎(chǔ)”的網(wǎng)頁,這些網(wǎng)頁針對“seo基礎(chǔ)”作了很好的優(yōu)化,但是并沒有出現(xiàn)一處“入門”??梢奊oogle把“入門”和“基礎(chǔ)”看成極為接近的詞。
Google的PR和百度的超鏈分析。
網(wǎng)絡(luò)上對這一分析很多,其中最重要的兩句是:
“超鏈分析要解決的是文件與搜索關(guān)鍵詞的相關(guān)性。李彥宏提出的方法是,除了文件本身對關(guān)鍵詞的引用外,還需要考慮反向鏈接中的關(guān)鍵詞?!?/P>
“在Google的專利申請中,明確提到即使在考慮了指向文件的鏈接及鏈接錨文字之后,搜索引擎還有重要問題需要解決,那就是來自不同文件的鏈接有不同的權(quán)重值?!?/P>
我個(gè)人總結(jié)了一下,在關(guān)鍵詞分析方面,所有搜索都對標(biāo)簽有所分析,但YAHOO的比重大些,GOOGLE還會(huì)分析語義及反向鏈接的質(zhì)量及相關(guān)性。BAIDU的所謂中文分詞算法也只是對中文詞語的邏輯性分析比較強(qiáng),語義分析沒怎么樣。這三大搜索引擎只有GOOGLE對META標(biāo)簽還是有所看重,description中的關(guān)鍵詞仍被加紅顯示,GOOGLE對所謂的標(biāo)準(zhǔn)站點(diǎn)比較看重??梢钥吹?,反向鏈接質(zhì)量和數(shù)量較低的網(wǎng)站來自百度和GOOGLE的流量天差地別。而YAHOO關(guān)鍵詞排名對首頁比較看重,內(nèi)頁關(guān)鍵詞不容易被深挖。GOOGLE對反向鏈接質(zhì)量區(qū)別很嚴(yán),非??粗貋碜皂撁娴燃壐叩逆溄樱俣瓤此茖κ醉撴溄痈矚g一些。
短時(shí)間的大量群發(fā)鏈接,會(huì)導(dǎo)致網(wǎng)站在GOOGLE中進(jìn)沙盒,但從沙盒出來以后鏈接仍有效果,不知道大家的站有沒有進(jìn)過沙盒。而YAHOO效果則很明顯。但當(dāng)一段時(shí)間鏈接不再增加以后,排名下降也會(huì)很快,YAHOO非??粗貢r(shí)效性。百度反作弊算法則認(rèn)為群發(fā)鏈接是作弊,遞交人工審查后,垃圾站立馬被封。如果你站美工好點(diǎn),或者是商業(yè)站點(diǎn),或許會(huì)幸運(yùn)一點(diǎn),要么首頁被封,要么撒事沒有。
這個(gè)我做過很多實(shí)驗(yàn),垃圾站100%被封。對于反作弊,YAHOO以前顯然很不到位,但是現(xiàn)在弄出一個(gè)有獎(jiǎng)搜蟲計(jì)劃,對于鏈接工廠,K的比百度GOOGLE還要嚴(yán)重。GOOGLE有著一套對首頁和內(nèi)頁明顯不同的檢查標(biāo)準(zhǔn),想作弊不被K,請用內(nèi)頁優(yōu)化,呵呵。
接著給大家講講拆分式優(yōu)化。
字面上大家可以看的出來,拆分也就是說把你所需要優(yōu)化的關(guān)鍵詞進(jìn)行拆開,分解成一些比較常規(guī)的詞語、字或者短語。這樣做的用途是減輕主關(guān)鍵詞的競爭壓力、利用分解詞語推動(dòng)主關(guān)鍵詞的排名提升。
年前我做了個(gè)站:上海機(jī)票 www.521yy.com 機(jī)票這樣的詞,看都不用看就知道競爭是很激烈的,如果按照常規(guī)的優(yōu)化方法去做難度是很大的,而且 www.521yy.com 的域名質(zhì)量及權(quán)重都不是很高,所以我改用了分解關(guān)鍵詞的優(yōu)化方式,首先將關(guān)鍵詞“飛機(jī)票”拆分成“飛、飛機(jī)、機(jī)票、票”這4個(gè)常規(guī)詞,添加了大量與這4個(gè)詞有關(guān)的新聞及文章,在文章中“飛、飛機(jī)、機(jī)票、票”都以加粗處理 并在文章中用到《h1》,《h2》,《h3》和《strong》標(biāo)簽,通過這些拆分后的關(guān)鍵詞進(jìn)行輔助優(yōu)化后,效果就很不錯(cuò)。
分解優(yōu)化需要涉及到《h1》,《h2》,《h3》和《strong》的用法,特別是博客。為什么呢?因?yàn)橛行┖芎玫牟┛鸵呀?jīng)做了很好的SEO,只要稍作優(yōu)化,加強(qiáng)連接及連接廣泛度就能取得很好的成績。大家都知道這幾個(gè)標(biāo)簽對于搜索引擎來說有比較重要的作用,在里面適當(dāng)?shù)姆派详P(guān)鍵詞有利于排名,但是標(biāo)簽的位置和標(biāo)簽的使用度一定要把握,不然也會(huì)被搜索引擎認(rèn)為是作弊而打入沙盒或者直接K掉。
大家都知道,SEO的一個(gè)很重要的一點(diǎn)就是要把網(wǎng)站做的條理清晰,讓搜索引擎很容易的讀明白,讓蜘蛛爬行通暢,這個(gè)條理清晰不僅體現(xiàn)在網(wǎng)站的物理路徑、URL等地方,在《h1》《h2》《h3》等方面也是這樣。并不是《h1》對于關(guān)鍵字排名有幫助,如果在任何有關(guān)鍵詞出現(xiàn)的地方我們都用《h1》的話,這樣可能會(huì)被懲罰或者被搜素引擎降低你《h1》的權(quán)重而無法體現(xiàn)關(guān)鍵詞的重要性。《h1》《h2》《h3》需要層層遞進(jìn),依次類推主導(dǎo)詞,使得搜索引擎給予《h1》以很高的權(quán)重。
《h1》通常用于網(wǎng)站最重要的標(biāo)題,所以在標(biāo)題里面放上你網(wǎng)站的關(guān)鍵詞是很明智的做法。一個(gè)網(wǎng)站不僅僅只有一個(gè)頁面,還有很多欄目,欄目里面又還有子欄目,所以《h2》《h3》則分別用以類列表,內(nèi)容標(biāo)題列表,這樣網(wǎng)站標(biāo)題-欄目標(biāo)題-子欄目標(biāo)題-內(nèi)容列表標(biāo)題的關(guān)系層層遞進(jìn),思路清晰,搜索引擎就很容易分辨你網(wǎng)站的那個(gè)地方重要,哪個(gè)地方是次重要。我認(rèn)為,《strong》就沒有像《h1》《h2》《h3》這樣這么嚴(yán)格,在適當(dāng)?shù)奈恢枚伎梢杂么藰?biāo)簽來重點(diǎn)突出關(guān)鍵詞。
總的來說,這2種類型標(biāo)簽相輔相成,要靈活的配合使用,會(huì)使你的網(wǎng)站層次分明,重點(diǎn)突出。對于標(biāo)簽的使用我覺得大家應(yīng)該多去google管理員博客看看,因?yàn)樗阉饕媸遣粩喔伦兓模粤私獾阶钚碌膭?dòng)態(tài)才能取得好的成績。只有你讓搜索引擎更輕松的閱讀你的網(wǎng)站,對于你重點(diǎn)體現(xiàn)的地方它就更容易讀出來,當(dāng)然在排名上也就賦予了你更高的權(quán)重。層層遞進(jìn),以次推主。
最后我再對seo一些常見現(xiàn)象做一個(gè)說明。
1.提交網(wǎng)站至相關(guān)目錄
這幾乎是所有需要搜索引擎的站長都建議的方法,不過我好久不用了,因?yàn)樾蕵O低。
2.網(wǎng)站內(nèi)部結(jié)構(gòu)優(yōu)化,頁面靜態(tài)化
這種做法是非常有效且必要的,也是“講道德的”SEO所做的最重要的核心工作,屬于正常優(yōu)化。也是我們所說的白帽優(yōu)化。
3.關(guān)鍵字密度
搜索引擎早期最原期的作弊手法之一。不過現(xiàn)在搜索引擎幾乎不再懲罰了,但這種作弊起不到什么效果。只有在碰巧的情況下,會(huì)有個(gè)把關(guān)鍵詞排名還不錯(cuò)。想要穩(wěn)步提升關(guān)鍵詞排名,靠它幾乎是沒什么門了。
4.隱藏文字連接
隱藏文字連接和跳轉(zhuǎn)是GOOGLE最反感的作弊方式之一,多用于消除FLASH頁面不利于優(yōu)化的缺點(diǎn),其實(shí)只需要把頁面結(jié)構(gòu)美化一下,這種風(fēng)險(xiǎn)實(shí)在是沒有必要冒。
5.頁面跳轉(zhuǎn)
和隱藏文字一樣,屬于沒有必要的風(fēng)險(xiǎn),一般SEO也不太愿意做這種事,多數(shù)是被客戶或是現(xiàn)實(shí)逼迫的。
6.鏈接工廠
當(dāng)前最最流行的作弊方式之一,但是由于網(wǎng)絡(luò)情況的復(fù)雜,大量網(wǎng)址站的存在,BLOG友情鏈接推薦等等和它相似但不屬于作弊情況的存在,使搜索引擎始終沒有辦法徹底清除。它對關(guān)鍵詞排名效果是最最明顯的,一旦被發(fā)現(xiàn),將是致命的打擊。
7.信息群發(fā)
和鏈接工廠一樣,以前對于搜索引擎來說信息群發(fā)并不是作弊。GOOGLE對留言本采取寬容的態(tài)度,只是降低留言本鏈接的權(quán)值,并不加以懲罰。但以人工編輯為主的百度來講,這是一種絕對不能容忍的行為。這也是許多網(wǎng)站在GOOGLE中排名很好,但卻被百度拒絕收錄的主要原因之一。