Moderne XML-Sitemaps, wie sie heute für Suchmaschinen verwendet werden, wurden vom Marktführer Google initiiert. Das in XML (Extensible Markup Language) verfasste Sitemap-Protokoll ermöglicht Betreuern von Webpräsenzen, Suchmaschinen über Ihr Angebot an einzelnen Webseiten schnell und effizient zu informieren.
Der Einsatz des Sitemaps-Protokolls soll eine verbesserte Indexierung von Webseiten ermöglichen. Es handelt sich um eine einfache Art der Strukturübermittlungen von Webangeboten. Der Inhalt eines Webauftritts kann so besser im Gesamten von den eingesetzten Crawlern analysiert - und schließlich die Indexierung bei Suchmaschinen eingeleitet werden. Die Sitemap.xml wird überlicherweise im Wurzelverzeichnis des Webautritt abgelegt. Sollte eine robots.txt Datei vorhanden sein, kann dort der Pfad zur Sitemap mit einer einfachen Zeile, wie "Sitemap: https://www.meinehomepage.com/sitemap.xml, angegeben werden. [mehr zu Robots.txt]
Was ist eine Sitemap?
Eine Sitemap ist letztendlich eine einfache Textdatei, geschrieben und abgespeichert in der Extensible Markup Language, kurz XML. Die Sitemap.xml stellt dabei ein Protokoll und gleichzeitig einen weltweit homogenen Standard dar. Das Standard-Kürzel (xml) stellt sogleich die Dateiendung dar. XML wurde für den plattformunabhängigen Austausch von Daten ins Leben gerufen, was vor allem im Internet eine schnelle, effiziente und einfach zu konfigurierende Datenübergabe ermöglicht. Google führte bereits im Jahr 2005 das Goolge-Sitemap-Programm ein. Der Einsatz von XML erfolge im Jahr 2006. Zuvor konnten Betreiber von Webseiten in der Hypertext Markup Language(HTML) eine Sitemap zur Verfügung stellen. Sie diente auch der Gesamtübersicht für den Seitenbesucher.
XML-Dateien können mit einfachen Texteditoren verfasst werden. Kostenfreie Programme, wie Notepad (MS Windows), TextEdit (Texteditor von Apple) oder spezialisierten XML-Editoren, wie XML Notepad oder Oxygen XML, bieten sich dazu an
Wer betreut den Sitemap-Standard?
Betreut und weiterentwickelt wird der Sitemap-Standard von einem Arrangement von Suchmaschinenanbietern, insbesondere Google, Yahoo und Bing (Microsoft). Hierzu wurde die Domain Sitemaps.org zur Verfügung gestellt, welche auch einen umfangreichen Anleitungsbereich (FAQ-Bereich) aufweist und insbesondere Fragen zum aktuellen Standard beantworten soll. Sitemaps.org wird in diversen Sprachen abgeboten. Die Ausgabesprache lässt sich in der Titelseite einstellen.
Wie ist eine Sitemap aufgebaut?
Relativ einfach! Dabei kann eine Grunddefinition oder erweiterte Protokollangabe vom Betreiber der Webseite erstellt werden. Die Beispiele dieses Artikels sind auf die gängigen Angaben beschränkt, welche oft ausreichend sind.
Im einfachsten Fall wird nur der Uniform Resource Locator (URL) angegeben. Diese URL (Webseitenadresse) wird zwischen den Auszeichnungsmarkierungen (sog. <TAGs>) platziert. Die sitemap.xml könnte dann so aussehen:
<!--
BEISPIEL EINER EINFACHEN SITEMAP
-->
<urlset xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd">
<url>
<loc>https://www.meinehomepage.de/</loc>
</url>
<url>
<loc>
https://www.meinehomepage.de/angebot
</loc>
</url>
<url>
<loc>https://www.meinehomepage.de/kontakt</loc>
</url>
</urlset>
Hier im Beispiel mit 3 Ziel-URLs. Der Uniform Resource Locator (URL) ist die Adresse der einzelnen Webseite. Die Datei kann natürlich um beliebig viele URLs erweitert werden. Es wird allgemein empfohlen, nicht mehr als 50.000 URLs in einer Datei zu verwenden. Allerdings können mehrere Sitemaps erstellt und im Wurzelverzeichnis der Webpräsenz abgelegt werden. Das einfache Beispiel ist begrenz auf die Adressen der einzelnen Seiten.
Die Tags (Auszeichnungsmarkierungen)
<urlset>: Leitet die die Sitemap ein. Verweist auf den aktuellen Protokollstandard. </urlset> schließt die Sitemap. Die zusätzlichen Angaben in diesem Tag dienen nur dem Verweis auf den offiziellen Standard.
<url>: (Uniform Resource Locator) Übergeordneter Tag für jeden Adresseintrag und verbundenen Zusatzinformationen. Abgeschlossen wird der Bereich mit </url>.
<loc>: (Location) Die eigentliche Adresse. Diese muss mit einem Protokoll beginnen (meist "http"). </loc> schließt die Adressierung.
WEITERE ANGABEN
<lastmod>: Gibt an, wann die Webseite zuletzt geändert wurde. Abgeschlossen mit</lastmod>.
<priority>: Teilt der Suchmaschine mit, wie wichtig welche Seite im Verhältnis zu den anderen ist. Eine Priorität von "1.00" ist dabei die höchste Stufe, "0.00" die niedrigste. Abgeschlossen wird mit </priority>
<!--
BEISPIEL EINER ERWEITERTEN SITEMAP
-->
<urlset xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd">
<url>
<loc>https://www.meinehomepage.de/</loc>
<lastmod>2026-04-14T10:43:02+00:00</lastmod>
<priority>1.00</priority>
</url>
<url>
<loc>
https://www.meinehomepage.de/angebot
</loc>
<lastmod>2026-04-14T10:43:02+00:00</lastmod>
<priority>0.90</priority>
</url>
<url>
<loc>https://www.meinehomepage.de/kontakt</loc>
<lastmod>2026-04-14T10:43:02+00:00</lastmod>
<priority>0.80</priority>
</url>
</urlset>
Mehr Informationen über Sitemaps und dessen Standard: Sitemaps.org | Offizielle Webpräsenz für den Sitemap XML Standard
