談百度判斷采集和權重 采集小型網站是不錯選擇 |
發布時間: 2012/7/10 17:45:36 |
隨著國內大型CMS 動易、新云、DEDECMS 以及其他各式樣的CMS 增加采集功能,網絡就到處是采集了!利用這些采集工具不用很長時間,便可以做出N多垃圾站點。
當論壇采集工具也出現的時候,采集之風就更甚了!基本上網站站點可以隨意復制了! 既然本文談的是采集與權重,我現在好像離題了,我們進入正題。 首先來說下我的環境! 網站類型:分類信息網 域名注冊年限:2年 在百度權重:比被采集站點站點相比要高點 目的:把采集變原創,保證排名和權重 搜索引擎:百度 我們首先來看下,百度是怎么樣來判斷一個信息是原創還是采集的! 1.一條信息----2.百度----3.百度蜘蛛---4.蜘蛛收錄此頁面---5.規則審核---6.入庫并顯示在結果里 按照百度的規律 一條信息從收錄到顯示結果基本就這幾步! 這幾步最塊也要2天時間才能完成,從1到5 基本上最快也要1天。你不要問我說!我剛發布的他就會收錄了?只要你沒被K,基本上百度蜘蛛是把你的數據臨時保存起來的。通過5 才會顯示在搜索結果內的! 當你的信息進入5的時候!百度也就是在這個階段判斷是否原創或者采集的!也是從這里決定你的排名高低的! 按照上面來說,你有至少1天時間來進行操作,使百度認為你就是原創! 列出例子說明: 被采集站點每天大概有500條新的分類信息 我利用采集工具設置自動采集!每日 8點 10點 12點 14點 16點 18點 20點 22點 0點 進行采集!!并且進行直接入庫!基本上我站信息和被采集站信息發布時間誤差不超過30分鐘! 我們來看下 百度是怎么判斷的: 規則審核:1.對比現有數據,數據庫中是否有存在相同內容,不存在就直接收錄 默認此信息屬性為原創。 2.對比現有數據,數據庫中是否有存在相同內容,存在就進入下個對比。 3.存在相同內容,就對比A和B的所屬網站在百度權重.權重高者勝出!低著則排在后面!或者直接刪除。 知道了百度的審核的機制 我們就很好來操作了!及時更新了。說白了,就是及時采集。我的例子說過了!他最新的信息,我采集過來誤差不超過 0分鐘.百度在這個30分鐘內,是不可能把這個信息內容緩存起來的。到了這里,就要看百度更新誰的網站快了。誰的網站先更新,那誰就是原創!! 為什么你也是及時采集了他,但是仍然和他不能比! 那就是因為百度先更新的是他!他在規則審核中勝出了!!為什么先更新他?他權重比你高! 說到權重 我說下百度如何判定權重的: 1.外鏈 2.網站運營時間的長短 3.流量 4.采用的編寫語言 這只是一部分! 還有的我不在鏊述! 要高質量的友情連接,和百度K過的站做連接,你那是找K!運營時間的長短 要看個人站長的 毅力和專注了。經常改變主題改變定位的站,百度不喜歡!一天是音樂,第二天變小說了!百度絕對會在你第三次改之前K了你。 流量也是一部分先決條但不是絕對!!網站使用的腳本語言!當然能靜態化的就靜態化把!如果自己開發能力不怎么樣,還是使用現有的CMS吧! 總而言之,想盡一切辦法縮小采集更新的時間,想盡一辦法提高自己權重!還有一條!有很多小型網站是你采集的不錯選擇! 本文出自:億恩科技【www.vbseamall.com】 |