Örüt ağ üzerinde bulunan sayfaları gezen, onları belleğine alan uygulamalara örümcek ismi veriliyor.
Türkçe karşılığı daha uygun olduğu için gezgin diye isimlendirebiliriz.
Gezgin ilk olarak verdiğiniz adresin ana sayfasına gidiyor.
Bağlantıları takip ederek sayfaları gezmeye başlıyor. Burada gezginin aynı alan adı içerisinde mi kalması gerektiğini yoksa başka alan adlarını da gezip gezmeyeceğini siz belirleyebiliyorsunuz.
Daha sonra DFS, BFS gibi bir arama algoritması kullanarak sayfaları gezmeye başlıyor.
Arama motorları da bu gezgin ismi verilen yazılımları kullanarak örüt ağ sayfalarını kaydediyorlar.
Gezgin kullanarak kendi site haritamızı oluşturabiliriz.
Python için gerekli paketleri pip ve virtualenv kullanarak kurabilirsiniz. Bunun için Flask dersinin başlangıç bölümüne bakabilirsiniz.
Örneğimize bakacak olursak aşağıdaki örnek Python ve xml kullanarak basit bir site haritası oluşturuyor.
from xml.etree import ElementTree
from xml.dom import minidom
from xml.etree.ElementTree import Element,\
SubElement, tostring, fromstring
harita = Element('url')
adres = SubElement(harita, 'loc')
adres.text = "https://programlama.tk"
sondeğişiklik = SubElement(harita, 'changefreq')
sondeğişiklik.text = 'weekly'
öncelik = SubElement(harita, 'priority')
öncelik.text = '0.8'
dönüştür = minidom.parseString(tostring(harita)).toprettyxml()
sonuç = ElementTree.ElementTree(fromstring(dönüştür))
sonuç.write("harita.xml",encoding='utf-8', xml_declaration=True)
Uygulamayı çalıştırdığımızda oluşturulan xml kütüğüne bakabiliriz.
Örüt ağ üzerinde bulunan sayfaları gezen, onları belleğine alan uygulamalara örümcek ismi veriliyor.
Türkçe karşılığı daha uygun olduğu için gezgin diye isimlendirebiliriz.
Gezgin ilk olarak verdiğiniz adresin ana sayfasına gidiyor.
Bağlantıları takip ederek sayfaları gezmeye başlıyor. Burada gezginin aynı alan adı içerisinde mi kalması gerektiğini yoksa başka alan adlarını da gezip gezmeyeceğini siz belirleyebiliyorsunuz.
Daha sonra DFS, BFS gibi bir arama algoritması kullanarak sayfaları gezmeye başlıyor.
Arama motorları da bu gezgin ismi verilen yazılımları kullanarak örüt ağ sayfalarını kaydediyorlar.
Gezgin kullanarak kendi site haritamızı oluşturabiliriz.
Python için gerekli paketleri
pip
vevirtualenv
kullanarak kurabilirsiniz. Bunun için Flask dersinin başlangıç bölümüne bakabilirsiniz.Örneğimize bakacak olursak aşağıdaki örnek Python ve xml kullanarak basit bir site haritası oluşturuyor.
Uygulamayı çalıştırdığımızda oluşturulan xml kütüğüne bakabiliriz.
Burada "loc" gezilen adresi, "changefreq" sayfanın değişme sıklığını, "priority" ise sayfanın önceliğini gösteriyor.
Bu bilgilerden sonra gezgin yazılımımını aşağıda bulabilirsiniz.
Burada adres bölümüne kendi sitenizin adresini yazıp site haritası oluşturabilirsiniz.
Gezilen sayfa sayısı
.visited
6 olduğu zaman örümcek duruyor. Gezilecek sayfa sayısını arttırabilirsiniz.Ayrıca gezginin gezinmesini istemediğimiz sayfaları liste isimli değişkene ekleyerek belirleyebiliyoruz.
python3 python siteharitası xml gezginyanıtla
Yanıt yaz