Pagerank Nedir?
Page Rank Nedir?
Pagerank metodu Google tarafından, sitelerin birbirleriyle orantılı olarak önemlerini yani kısaca popüleritelerini tespit etmek için bulundu. Bu metod oluşturulurken siteler arasındaki linkler baz alınarak internetteki topoloji örneklendi.
Page Rank'in ana fikri şöyledir: Eğer bir A sitesi B sitesinin linkini yayınlamışsa bunun nedeni B sayfasının A sayfası ziyaretçileri tarafından dolaşılabilecek olarak düşünülmüş olmasıdır. Bu yapıya göre A sayfası B sayfasının pagerankini yükseltmiş olacaktır.
Ancak Pagerank kavramı sadece bunlarla sınırlı değildir. Aşağıda belirttiğim iki fikir de önemli başrol oynar.
- A sayfası ne kadar yüksek pageranke sahipse B sayfasının pagerank değeri de buna orantılı olarak artacaktır.
- A sayfasında ne kadar az dışarı link varsa, B sayfasının pagerank değeri o kadar yüksek olacaktır. Bu mantığa göre A sayfası sadece B sayfasını link verilecek değerde görmüşse, B sayfasının pageranki çok daha fazla artacaktır.
Mantığı açıkladıktan sonra, bu sistemi gelin formülize edelim. Başlamadan önce açıklayalım, bu formülü Google'ın iki kurucusundan aldık. Formül şu ana kadar değişilik geçirmiştir ancak temel mantığı halen aynıdır.
A 1, A 2 , ..., An B sayfasına link veren sayfalar olsun. PR(Ak)'yı da A k sayfasının pageranki olarak kabul edelim. N(Ak) ise Ak sayfasının dış sayfalara verdiği link sayısı olsun. d ise 0 ile 1 arasında değişen ve genellikle 0.85 olan bir katsayı olsun.
Bu durumda PageRank'in matematiksel değeri şöyle olacaktır:
PR(B) = (1-d) + d x ( PR(A1) / N(A1) + ... + PR(An) / N(An) )
Belki bu formülün hem basit hem de karmaşık olduğunu düşünebilirsiniz. Basit çünkü sadece birkaç koşula bağlı, karmaşık çünkü hesaplamak için daha önceden başka bir sitenin pagerankini hesaplamanız gerekir.
Aslında bu çok basittir, tüm pagerankleri belli bir değere sabitlerseniz olur biter. Eğer her sayfaya aynı değeri verirseniz; bu değeri kaç alırsanız alın sonuç değişmeyecektir.
Formülü tekrarlamaya başladığınızda sonuç bir önceki hesaplamaya bağlı olarak tekrar hesaplanacaktır. İşlem ilerledikçe pagerank değerleri yerine oturmaya başlayacak, ve bir hesaplamadan diğerine kadar hiçbir değişiklik olmayacaktır.
Rastgele Yürüme Modeli
PageRank değerinin hesaplanmasında formül dışında bir başka model daha vardır. Bu model de internetde dolaşan birinin simüle edilmesiyle, rastgele linkler arasında dolaşılmasıdır.
Bir düşünün, birisi bir sayfada dolaşırken bir link dikkatini çeker ve ona tıklayarak o sayfada dolaşmaya başlar. Böylece giderek birçok sayfa dolaşılır .
Page Rank değeri bir ziyaretçinin sayfada harcadığı süreye de bağlı olabilir.
Eğer gidilen bir sayfada geriye dönüş için de link bulunuyorsa olasılık daha da artacaktır. Bu da formülün ikinci terimine denk gelmektedir.
İlk terim ise sayfadan çıkılmadan içeri de ne kadar dolaşılabileceği olasılığını modeller. Formülde ifade ettiğmiz d sembolü aslında budur.