Arama Motorları Nasıl Çalışır?

Pek çok kişi için Google İnternet’tir. Muhtemelen İnternet’in kendisinden beri en önemli icattır. Arama motorları o zamandan beri çok değişmiş olsa da, temel ilkeler hala aynı.

Google Search Engine

Birçoğu için Google internettir. Yeni siteler bulmanın başlangıç noktasıdır ve tartışmasız internetin kendisinden beri en önemli icattır. Arama motorları olmasaydı, yeni web içeriğine kitleler tarafından erişilemezdi.

Ama arama motorlarının nasıl çalıştığını biliyor musunuz? Her arama motorunun üç ana işlevi vardır: tarama (içeriği keşfetmek için), indeksleme (içeriği izlemek ve depolamak için) ve geri alma (kullanıcılar arama motorunu sorguladığında ilgili içeriği almak için).

Crawling

Tarama, her şeyin başladığı yerdir: bir web sitesi hakkında verilerin toplanması.

Bu, siteleri taramayı ve her bir sayfayla ilgili ayrıntıları toplamayı içerir: başlıklar, resimler, anahtar kelimeler, diğer bağlantılı sayfalar, vb. Farklı tarayıcılar, sayfa düzenleri, reklamların yerleştirildiği yer, bağlantıların sıkıştırılıp sıkıştırılmadığı vb.

Ancak bir web sitesi nasıl taranır? Otomatik bir bot (“örümcek” olarak adlandırılır), daha sonra nereye gideceğini bulmak için sayfa bağlantılarını kullanarak olabildiğince hızlı bir şekilde her sayfayı ziyaret eder. En eski günlerde bile, Google’ın örümcekleri saniyede birkaç yüz sayfa okuyabiliyordu. Bugünlerde, binlerdedir.

Bir web tarayıcısı bir sayfayı ziyaret ettiğinde, sayfadaki her bağlantıyı toplar ve onları sonraki ziyaret edilecek sayfalar listesine ekler. Listesinde bir sonraki sayfaya gider, o sayfadaki bağlantıları toplar ve tekrar eder. Web tarayıcıları, herhangi bir değişiklik olup olmadığını görmek için arada bir geçmiş sayfaları yeniden ziyaret ederler.

Bu, dizine eklenmiş bir siteden bağlanan herhangi bir sitenin sonunda taranacağı anlamına gelir. Bazı siteler daha sık taranır ve bazıları daha derinlemesine taranır, ancak bazen bir sitenin sayfa hiyerarşisi çok karmaşıksa tarayıcı pes edebilir.

Bir web tarayıcısının nasıl çalıştığını anlamanın bir yolu, kendiniz bir tane oluşturmaktır.

Google Search on Tablet

Sayfaların “noindex” olarak işaretlenebileceğini unutmayın; bu, arama motorlarından indekslemeyi atlamalarını istemeye benzer. İnternetin dizine eklenmemiş bölümleri “deep web” olarak bilinir ve TOR ağında barındırılanlar gibi bazı siteler arama motorları tarafından dizine eklenemez.

Indexing

İndeksleme, bir taramadan gelen verilerin işlenip bir veritabanına yerleştirilmesidir.

Sahip olduğunuz tüm kitapların, yayıncılarının, yazarlarının, türlerinin, sayfa sayılarının vb. Bir listesini yaptığınızı hayal edin. Tarama, her kitabı taradığınızda, indeksleme ise onları listenize kaydettiğiniz zamandır.

Şimdi bunun sadece kitaplarla dolu bir oda değil, dünyadaki her kütüphane olduğunu hayal edin. Bu, tüm bu verileri binlerce petabaytlık sürücüye sahip geniş veri merkezlerinde depolayan Google’ın yaptığı şeyin küçük ölçekli bir versiyonu.

Google’ın arama veri merkezlerinden birine bir göz atalım:

Google Data Centers
Google Veri Merkezi

Erişim ve Sıralama

Erişim, arama motorunun arama sorgunuzu işlediği ve sorgunuzla en alakalı sayfaları döndürdüğü zamandır.

Çoğu arama motoru, erişim yöntemleriyle kendilerini farklılaştırır: Bulmak istediklerinize en uygun sayfaları seçmek için farklı kriterler kullanırlar. Bu nedenle, arama sonuçları Google ve Bing arasında farklılık gösterir.

Sıralama algoritmaları, her birinin alaka düzeyini belirlemek için arama sorgunuzu milyarlarca sayfaya göre kontrol eder. Şirketler, sıralama algoritmalarını karmaşıklıkları nedeniyle patentli endüstri sırları olarak korurlar. Daha iyi bir algoritma, daha iyi bir arama deneyimine dönüşür.

Ayrıca, web içerik oluşturucularının sistemi oynamasını ve haksız yere arama sonuçlarının tepesine tırmanmasını istemiyorlar. Bir arama motorunun dahili metodolojisi ortaya çıkarsa, her türden insan bu bilgiyi kesinlikle sizin ve benim gibi araştırmacıların zararına kullanır.

Elbette arama motoru sömürüsü mümkündür, ancak artık o kadar kolay değil.

Başlangıçta, arama motorları siteleri anahtar kelimelerin bir sayfada ne sıklıkta göründüğüne göre sıraladı ve bu da “anahtar kelime doldurmaya” – sayfaları anahtar kelime ağırlıklı saçmalıklarla doldurmaya yol açtı.

Ardından bağlantı önemi kavramı geldi: arama motorları, sitenin popülerliğini alaka düzeyi olarak yorumladıkları için çok sayıda gelen bağlantı içeren sitelere değer veriyordu. Ancak bu, web’in her yerinde spam göndermeye yol açtı. Günümüzde arama motorları, bağlantı veren sitenin “otoritesine” bağlı olarak bağlantıları ağırlıklandırmaktadır. Arama motorları, bir devlet kurumundan gelen bağlantılara, bir bağlantı dizinindeki bağlantılardan daha fazla değer verir.

Bugün, sıralama algoritmaları her zamankinden daha fazla gizem içinde ve “arama motoru optimizasyonu” o kadar önemli değil. İyi arama motoru sıralamaları artık yüksek kaliteli içerikten ve harika kullanıcı deneyimlerinden geliyor.

Arama Motorlarında Sırada Ne Var?

Ama işte işin özü.

Şu anda, “glütensiz kurabiyeler” için arama yapabilirsiniz, ancak sonuçlar glütensiz kurabiyeler için tarifler döndürebilir. Bunun yerine, “Bu tarif glütensiz değildir” diyen normal kurabiye tarifleri bulabilirsiniz. Doğru anahtar kelimelere sahip, ancak yanlış anlama sahip.

Anlambilimle kurabiye tariflerini arayabilir ve ardından belirli malzemeleri kaldırabilirsiniz: un, kuruyemiş vb. Ayrıca sonuçları yalnızca hazırlık süreleri 30 dakikadan az olan ve 4/5 veya daha fazla puanları gözden geçiren tarifleri içerecek şekilde daraltabilirsiniz. Bu harika olur, değil mi? Biz oraya gidiyoruz!

Bir web sayfasının anatomisini anlattığımız yazımıza buradan ulaşabilirsiniz.Hoşçakalın.

Kaynakça

www.makeuseof.com

Leave a Reply