Der Google-Bot ist ein Computer-Programm, welches nicht die optische Schönheit einer Website, sondern die Codebasis liest und beurteilt. Deshalb gibt es einige Optimierungsmöglichkeiten, die den Quelltext, also das HTML-Dokument und seinen strukturellen Aufbau, betreffen.
Um die grundsätzliche Qualität der Programmierung zu beurteilen, kann man z. B. den W3C HTML und den CSS Validator einsetzen. Die Testergebnisse zeigen, wie gut der Quelltext den HTML/CSS-Standards entspricht.
Meta-Tags
Eines der zahlreichen SEO-Tools ist SEORCH . Das kostenlose Online-Tool bietet eine umfangreiche, aber dennoch recht verständliche SEO-Analyse und gibt Hinweise zur Optimierung von SEO-Faktoren. Die beiden wichtigsten SEO-Faktoren sind der Seitentitel (title) und die Meta Description (Seitenbeschreibung). Der Seitentitel wird im Browser im Karteireiter angezeigt. Außerdem wird er in den Google-Suchergebnissen als Titel der Seite angezeigt. Darunter steht in den Suchergebnissen bei Google die Description, also ein Kurztext, der das Thema der gefundenen Seite beschreibt. Beides sind Meta-Tags, die im Head-Bereich des HTML-Dokuments stehen und beide sollten individuell für jede Unterseite verfasst werden.
Semantik
Semantik ist die Bedeutungslehre. Sie ist für die Bedeutung von Textinhalten wichtig. HTML ist eine Auszeichnungssprache, d.h. bestimmten Textteilen wird eine Bedeutung zugewiesen. Beispiele für solche bedeutungsvollen Textelemente sind Überschriften, Titel, Absätze, hervorgehobene Texte (fett oder kursiv), Zitate, etc. Deshalb ist die Einhaltung der Überschriften-Hierarchie der HTML-Überschriften-Ebenen H1 bis H6 wichtig. Der Firmenname oder das Logo im Kopf der Website sollte eine H1-Überschrift sein. Der Seitentitel ist dann eine H2. Unterüberschriften werden mit H3 ausgezeichnet usw.
Suchmaschinenfreundliche URLs
Beim Einsatz von Content-Management-Systemen, wie WordPress oder Joomla! sollte immer die Option „suchmaschinenfreundliche URLs“ aktiviert werden. Damit wird die URL, also die Adresse der einzelnen Webseite, lesbar mit Bindestrichen gestaltet. In einer URL sollten demnach keine Sonderzeichen (z.B. ?) und Zahlen (IDs), die auf die Verwendung von dynamisch generiertem Content hindeuten, auftauchen.
Duplicate Content
Duplicate Content (engl.: doppelter Inhalt) bezeichnet identische Textpassagen (Inhalte), die unter zwei oder mehreren URLs erreichbar sind. Duplicate Content sollte unbedingt vermieden werden. Der Inhalt einer Seite sollte immer nur über eine eindeutige URL erreichbar sein. Ein häufig auftretender Fall von Duplicate Content sind die Kategorie- und Produktseiten. Die identischen Beschreibungstexte sind dann häufig einmal auf der Kategorieseite und nochmals auf der Produktdetailseite zu lesen. Doppelte Inhalte entstehen auch dann, wenn Ihre Website nicht nur über http sondern auch über https zu erreichen ist (http://www.meineDomain.de und https://www.meineDomain.de) oder die Startseite sowohl über www.meineDomain.de als auch über www.meineDomain.de/index.php aufgerufen werden kann.
Beispiele für Duplicate Content Finder:
- www.siteliner.com
- www.copyscape.com
- www.webconfs.com (gibt die prozentuale Übereinstimmung zweier zu vergleichender Webseiten an)
Wenn Sie Duplicate Content auf Ihrer Website identifiziert haben, dann sollten Sie mit Hilfe des Canonical-Tags (auch: Canonical-Link oder Canonical-URL), einem Meta-Tag, Google mitteilen, welcher Inhalt indexiert werden soll. Dazu können Sie auf der Seite, die den Duplicate Content enthält das folgende Meta-Tag setzen:
<link rel="canonical" href="http://www.meineDomain.de/seite.html">
Hinweis: einige Content-Management-Systeme, wie WordPress oder Joomla! bieten die Erstellung eines solchen Meta-Tags über das Backend an.
Liegt ein Inhalt in mehreren Sprachversionen vor, z.B. in deutscher und englischer Sprache, so wird dies nicht als Duplicate Content gewertet.