一般百度K站的主要導火線之一就是網(wǎng)站內(nèi)容重復,也有很多人的并不了解網(wǎng)站內(nèi)容重復的判斷依據(jù),而且也不清楚如何解決網(wǎng)站內(nèi)容重復的問題,其實網(wǎng)站內(nèi)容重復包括很多的方面,今天企億推小編針對幾種常見的情況進行一一介紹,希望可以幫到大家。
一、網(wǎng)站內(nèi)容重復的情況
1、同樣一篇文章出現(xiàn)多個URL,即使這篇文章屬于原創(chuàng),也會被百度給予懲罰。
2、網(wǎng)站內(nèi)容多為采集,這種網(wǎng)站內(nèi)容重復會被當做采集站直接被百度處理掉,百度新的綠蘿算法就是專門打擊采集站點的。
3、網(wǎng)站的固定版塊出現(xiàn)次數(shù)太多,很多網(wǎng)站的右側(cè)總是固定放一些版塊或欄目,這些欄目的內(nèi)容從來不進行更新,或者各個頁面的右側(cè)都是前篇一律的內(nèi)容,就會造成頁面重復度高。
4、未設(shè)置404錯誤頁面,當我們刪除某一個頁面的時候,一定要用404狀態(tài)碼給予用戶和蜘蛛一定的提示,如果代碼設(shè)置錯誤,那么刪除的頁面在蜘蛛那里是假想存在的,由此一來就會多次收錄。
5、動態(tài)頁面和靜態(tài)并存,百度爬去目錄時收錄了大量動態(tài)頁面
6、網(wǎng)站內(nèi)容以圖片為主,文字很少,很多圖片都是共用一個URL地址,這樣一來蜘蛛在索引的時候很難保證不被重復收錄。
重復內(nèi)容是指不同的URL鏈接內(nèi)容卻是相同的,同時收錄多個重復頁面,設(shè)置多個頁面進行介紹,但是網(wǎng)頁的大體內(nèi)容是相同的,這樣處理的方法是錯誤的。
二、重復內(nèi)容的檢測方法
1、對于檢測一篇文章是否重復內(nèi)容,title:+文章標題可找出相同的文章。
2、從文中摘取一段話,在百度搜一下,出現(xiàn)大量紅字,表明這篇文章的重復度高
3、站內(nèi)搜索,可以找到出現(xiàn)多次的內(nèi)容。
4、利用一些頁面相似度檢查工具,判斷一些相鄰頁面的相似度,80%以上相似度就需要對一些固定欄目進行處理。
三、如何消除重復內(nèi)容
原創(chuàng)內(nèi)容的增加
對于網(wǎng)站內(nèi)容多為采集或簡單偽原創(chuàng)的網(wǎng)站,企贏001建議增加原創(chuàng)文章的內(nèi)容,寧可百度收錄少一些,也不要讓百度把之前收錄的文章吐出來。
網(wǎng)站固定欄目內(nèi)容隨機展示
可以根據(jù)正文的關(guān)鍵詞,隨機調(diào)用右側(cè)欄目的文章內(nèi)容,讓每一個頁面都有不一樣的內(nèi)容,避免大量頁面相似度高的情況出現(xiàn)。
設(shè)置404頁面
告知用戶和搜索引擎某些頁面不存在了,防止搜索引擎收錄大量死鏈。
頁面設(shè)置獨立的Meta標簽
關(guān)鍵詞、標簽、描述,每一個頁面都需要不同,可以采用手動修改,或者根據(jù)一定的規(guī)則設(shè)置。
當你的網(wǎng)站內(nèi)容重復率并不高的時候,百度是不會惡意對網(wǎng)站進行懲罰,除非競爭對手對網(wǎng)站惡意破壞,為了避免網(wǎng)站被K站的坑,我們需要先檢測網(wǎng)站的重復問題,以免給網(wǎng)站后期的維護帶來不必要的麻煩。