濟南網站優化公司,為您提供專業的網站優化,排名優化,關鍵詞優化服務,seo優化師一對一對接,助您快速提升網站關鍵詞排名.

濟南網站優化

幫助企業快速提升網站排名和流量

專注網站優化,SEO關鍵詞排名,一切用數據說話!

整站優化業務咨詢

人與機智能:當'重復'內容是獨特的時,如何獲勝

點擊次數: 發布時間:2019-12-13 09:28文章來源:搜索引擎優化

令人印象深刻的是機器學習和基于算法的智能,它們往往缺乏人類自然而然的東西:常識。

眾所周知,在多個頁面上放置相同的內容會產生重復的內容。但是如果你創建關于類似事物的頁面會有什么影響呢?算法將它們標記為重復,盡管人類在將這些頁面分開時沒有問題:

電子商務:具有多種變體或關鍵差異的類似產品旅游:酒店分店,目的地套餐,內容相似分類:相同項目的詳盡列表業務:本地分支機構的頁面,在不同地區提供相同的服務這是怎么發生的?你怎么能發現問題?你有什么可以做的?

重復內容的危險重復內容會影響您通過以下方式搜索用戶,使您的網站可見:

丟失無意中競爭相同關鍵字的唯一網頁的排名無法對群集中的網頁進行排名,因為google選擇了一個網頁作為規范大量精簡內容丟失了網站權限機器如何識別重復內容google使用算法來確定兩個頁面或部分頁面是否是重復內容,而google將其定義為“ 明顯相似 ”的內容。

谷歌的相似性檢測基于他們的專利simhash算法,該算法可以分析網頁上的內容塊。然后,它為每個塊計算唯一標識符,并為每個頁面組成一個散列或“指紋”。

由于網頁數量巨大,因此可擴展性至關重要。目前,simhash是大規模查找重復內容的唯一可行方法。

simhash指紋是:

計算成本低廉。它們是在頁面的單個爬網中建立的。由于固定長度,易于比較。能夠找到近乎重復的東西。與許多其他算法不同,它們將頁面上的微小變化等同于散列中的微小變化。這最后意味著任何兩個指紋之間的差異可以通過算法測量并表示為百分比。為了降低評估每一頁網頁的成本,google采用了以下技術:

聚類:通過將多組足夠相似的頁面分組在一起,只需要比較聚類中的指紋,因為其他所有指針都已被分類為不同。估計:對于異常大的聚類,在計算一定數量的指紋對之后應用平均相似性。

###

最后,谷歌使用加權相似率排除相同內容的某些塊(樣板:標題,導航,側邊欄,頁腳;免責聲明......)。它考慮了頁面的主題,使用n-gram分析來確定頁面上哪些詞最常出現,并且 - 在站點的上下文中 - 是最重要的。

使用simhash分析重復內容我們將使用simhash查看標記為相似的內容集群的地圖。oncrawl的此圖表覆蓋了對重復內容群集的重復內容策略的分析。

oncrawl的內容分析還包括相似性比率,內容聚類和n-gram分析。oncrawl還在開發一個實驗性熱圖,表明每個內容塊的相似性可以覆蓋在網頁上。

###

使用規范驗證集群使用規范url來指示一組相似頁面中的主頁面是一種有意聚集頁面的方式。理想情況下,由規范創建的集群和由simhash建立的集群應該是相同的。

###

如果不是這種情況,通常是因為您的網站上沒有規范的政策:

###

或者因為您的規范策略與google用于對類似內容進行分組的方法之間存在沖突:

###

您網站的群集與上面的群集不同。您已經遵循了重復內容的最佳做法。包含相同內容的網址(例如可打印/移動版本或cms生成的備用網址)會聲明正確的規范網址。

###

過濾掉規范策略正確處理的重復內容。其余的非規范化url是您要排名的頁面。

###

仍然出現在基于simhash和語義分析的群集中的網址是您和google不同意的網址。

解決唯一內容的重復內容問題沒有令人滿意的技巧來糾正機器對看似重復的獨特頁面的看法:我們無法改變google識別重復內容的方式。但是,仍然有一些解決方案可以使您對獨特內容和google的感知保持一致......同時仍然會根據您需要的關鍵字進行排名。

以下是適應您網站的五種策略。

解決邊緣情況首先查看邊緣情況:具有非常低或非常高的相似率的聚類。

###

相似度低于20%:相似,但不太相似。您可以通過鏈接群集中的頁面,使用每個頁面的不同錨文本,通知google將它們視為不同的頁面。

###

最大相似度:找出潛在問題。您需要豐富內容以區分頁面或將頁面合并為一個頁面。減少方面的數量如果您的重復頁面與構面相關,則可能存在索引問題。維護已經排名的方面,并限制允許google編制索引的方面數量。

###

使頁面(更多)獨特請記住:內容的微小差異會在simhash指紋中產生細微差別。您需要對頁面上的內容進行重大更改,而不是進行小的調整。

豐富頁面內容:

向頁面添加文本內容。添加不同的圖像描述。包括完整的客戶評論(如果評論適用于多個頁面,請合并頁面!)。添加其他信息。添加相關信息。使用不同的圖像。使用非常不同的錨文本測試鏈接到不同的頁面。減少類似頁面之間共同的源代碼量。提高頁面的語義密度。增加與主題相關的詞匯量并減少填充。?

###

創建排名參考頁面如果無法或不適合豐富您的頁面,請考慮創建一個代替所有“重復”頁面的單個參考頁面。此策略使用與內容中心相同的原則來提升多個關鍵字的主頁面。當您需要將多個版本的產品作為單獨的頁面進行維護時,它尤其有用。

此策略可用于創建定位需求或季節性機會的網頁。它可以通過提供更強大的語義和排名來改善頁面族。

它還可以使分類廣告網站,工作機會網站和其他具有許多通常類似列表的網站受益。參考頁面應按單個特征對列表進行分組; 位置(城市)經常成功使用。

###

該怎么辦:

創建一個參考頁面,匯集所有“重復”產品頁面的語義內容。它應該宣傳您要使用的所有關鍵字并鏈接到所有“重復”頁面。將每個“重復”頁面的規范url設置為參考頁面,將參考頁面的規范url設置為自身。“重復”頁面之間的鏈接。優化網站導航以推廣參考頁面。通過“重復”頁面,規范聲明和組合內容的鏈接加強,參考頁面很容易排名。

合并你的頁面您一直在嘗試使用相同的內容來豐富頁面?你無法解釋為什么要保留它們?可能是時候將它們結合起來了。

###

如果您決定將您的網頁合并為一個:

保持表現最佳的網址。將您正在刪除的頁面重定向(301)到您要保留的頁面。將您要刪除的頁面中的內容添加到您保留的頁面中,并對其進行優化以對所有群集的關鍵字進行排名。重復內容的未來google能夠理解頁面內容的能力不斷發展。隨著越來越精確的識別樣板的能力以及區分網頁上的意圖,被識別為重復的獨特內容最終將成為過去。

在那之前,了解為什么你的內容看起來像谷歌的重復,并使其適應說服谷歌,是類似網頁成功搜索引擎優化的關鍵。

久久青草费线频观看