宸茬鐢╦avascript

日韩人妻无码精品无码中文字幕_蜜桃AV无码国产丝袜在线观看_少妇无码一区二区三区_中日韩精品卡一卡二卡3卡

CASES 案例 我們的作品,他們的故事
Our work, their stories
百度重點(dian)頁面判(pan)斷
網頁權威性是搜索引擎對結果進行排序的一個重要參考因素。
  計算網頁權威性時,將參與計算的所有網頁作為一個集合,并通過集合內網頁之間的鏈接關系迭代計算網頁的權威性。
  但是隨著互聯網的發展,互聯網上的網頁越來越多,如果將互聯網上所有網頁都作為參與權威性計算的網頁,則對計算系統的架構要求非常高,因此通常僅挑選各網站與外部網站存在鏈接關系的網頁作為參與權威性計算的網頁,但是現有技術的這種方式,會導致各網站內部的一些優秀網頁無法得到權威性值,此外,也會影響參與計算的網頁得到的權威性值的準確性。
 
為了改善上述問題,現有技術有一種做法,是將網站內與外部網站存在鏈接關系的網頁,以及網站內的一些重要網頁一起提取出來,作為參與網頁權威性計算的網頁。
  在現有技術中,是通過網站中網頁的站內反鏈數量來確定網頁的重要性的,例如將網站中站內反鏈數量大于設定閾值的網頁提取出來,如果這些網頁所指向網頁的站內反鏈數量也大于設定閾值,則將這些網頁及所指網頁作為重點網頁。但是這種現有技術的方法,召回率較低,準確性也較差。
  (來源于百度算法專利內容)
  新算法權威度調整
  1.網頁中的所有鏈接提取出來
  2.對網站所有鏈接進行拆分重組排列(源代碼里最近的鏈接組成)3.從各個鏈接(內鏈)中進行匹配出現值最高的鏈接 例:多次A鏈接B,或不同ABC鏈接D4.有一個預定的閥值,如果不超過閥值那么將歸類于普通頁面,如沒有任何重點頁面(入口頁)則僅留下首頁為重點頁面.
  5.重點鏈接是有數量上限,取決于鏈接對最多的頁面權威性,頁面權威性越高,重點頁面的數量就越高,比例通常在10-30%浮動,也就是一萬個頁面,可以出現1000-3000的參與排名的頁面。
  6.百度訓練模型將對鏈接對進行一次匹配分類,區分重要程度。
  7.百度訓練模型的對鏈接進行重要鏈接比對和非重要鏈接比對8.對重要鏈接進行分類特征對比,以確定重要鏈接的參數范圍和特征范圍。
  9.百度會對鏈接先進行參數范圍和特征范圍匹配,然后在進行重要程序分級。
  10.內鏈和反鏈的出面度是根據數量來決定,如果一個頁面有3個內鏈,那么他的出面度就是311.對重要頁面的深度進行說明,從首頁跳轉到對應頁面的最短次數,這個次數被定義為深度,重要頁面的深度會一定程度的影響頁面屬性。
  12.內鏈指向重要頁面的錨文本總數,是根據切詞組成,也就是例如抽動癥治療頁面指向給了抽動癥,那么抽動癥這個頁面的錨文本總數就是3個,抽動癥治療,抽動癥,治療。3個錨文本。
  13.根據重點頁面相互連接生成網站骨架,以定義網站的類型總結:頁面的權威度由頁面的深度,被指向內鏈的深度對比,錨文本詞頻、頁面出度、兩個頁面深度之間的差值來綜合評比頁面權威度。
 
       總結:頁面的權威度由頁面的深度,被指向內鏈的深度對比,錨文本詞頻、頁面出度、兩個頁面深度之間的差值來綜合評比頁面權威度。
最新資訊