Ich warne aber davor, dass man auf diese Weise Inhalte vortäuscht, die für die normalen Besucher dann gar nicht aufrufbar sind, weil nämlich bspw. Google sich hin und wieder als normaler User ausgibt, um zu kontrollieren, ob alles mit rechten Dingen zugeht.
Mit <!-- IF not S_IS_BOT --> (IF = wenn) und <!-- ENDIF --> kann man Inhalte für Suchmaschinen unsichtbar machen, die sonst sichtbar sind. Hierzu müssen die entsprechenden Container von diesen beiden Tags eingeschlossen sein. Und lässt man das 'not' weg, kann man Inhalte für Suchmaschinen sichtbar machen, die sonst für diese unsichtbar sind.
Bei dieser Gelegenheit schaue man sich am besten auch die anderen Tags an, um zu lernen! So gibt es bspw. auch <!-- ELSE --> (sonst), <!-- ELSEIF --> (sonst und wenn), <!-- BEGIN rules -->, <!-- END rules --> und <!-- INCLUDE jumpbox.html -->. Und man kann jeweils mehreres mit 'und', 'or' und Klammern (<!-- IF S_DISPLAY_SEARCH or (S_USER_LOGGED_IN and not S_IS_BOT) -->) zusammenfassen in diesen Tags.
Bei vielen dieser Tags, bspw. mit <!-- IF S_USER_LOGGED_IN -->, schließt man alle aus, die nicht eingeloggt sind, wodurch damit bereits auch Suchmaschinen ausgeschlossen sind, sodass man diese nicht mehr gesondert ausschließen muss.
Um jeweils zu prüfen, was Suchmaschinen sehen können, kann man sich seine Seiten bei den Webmaster-Tools von Google anschauen, wie sie von Google gesehen werden. Hierzu ruft man erst mal die Startseite auf.
https://www.google.com/webmasters/tools/home?hl=de
Dann fügt man seine Webseite, bzw. deren Domain hinzu. Da gibt es mehrere Dialogfehler, wo man bestätigen und beweisen muss, dass man der Inhaber dieser Seite ist.
Nachdem man dann irgendwann wieder die Startseite der Webmaster-Tools von Google aufgerufen hat, klickt man auf seine Webseite, die man ja zuvor hinzugefügt hatte. Auf der linken Seite sind dann zahlreiche Links.
Unter "Google Labs" ist dann der Unterpunkt "Abruf wie beim Googlebot", wo man seine Seite aufrufen kann wie, Google sie sieht. Allerdings wird nur der Quelltext angezeigt, den man aber bspw. mit nachfolgender Seite umsetzen kann.
http://www.mywebra.net/TP-Samples/codebox.html
Leider steht einem nur ein Kontingent von 50 Aufrufen zur Verfügung. Bei Erreichen erscheint oben die Meldung: "Ihr wöchentliches Kontingent an Anfragen wurde überschritten. Versuchen Sie es in einigen Tagen erneut."
Mit <!-- IF not S_IS_BOT --> (IF = wenn) und <!-- ENDIF --> kann man Inhalte für Suchmaschinen unsichtbar machen, die sonst sichtbar sind. Hierzu müssen die entsprechenden Container von diesen beiden Tags eingeschlossen sein. Und lässt man das 'not' weg, kann man Inhalte für Suchmaschinen sichtbar machen, die sonst für diese unsichtbar sind.
Bei dieser Gelegenheit schaue man sich am besten auch die anderen Tags an, um zu lernen! So gibt es bspw. auch <!-- ELSE --> (sonst), <!-- ELSEIF --> (sonst und wenn), <!-- BEGIN rules -->, <!-- END rules --> und <!-- INCLUDE jumpbox.html -->. Und man kann jeweils mehreres mit 'und', 'or' und Klammern (<!-- IF S_DISPLAY_SEARCH or (S_USER_LOGGED_IN and not S_IS_BOT) -->) zusammenfassen in diesen Tags.
Bei vielen dieser Tags, bspw. mit <!-- IF S_USER_LOGGED_IN -->, schließt man alle aus, die nicht eingeloggt sind, wodurch damit bereits auch Suchmaschinen ausgeschlossen sind, sodass man diese nicht mehr gesondert ausschließen muss.
Um jeweils zu prüfen, was Suchmaschinen sehen können, kann man sich seine Seiten bei den Webmaster-Tools von Google anschauen, wie sie von Google gesehen werden. Hierzu ruft man erst mal die Startseite auf.
https://www.google.com/webmasters/tools/home?hl=de
Dann fügt man seine Webseite, bzw. deren Domain hinzu. Da gibt es mehrere Dialogfehler, wo man bestätigen und beweisen muss, dass man der Inhaber dieser Seite ist.
Nachdem man dann irgendwann wieder die Startseite der Webmaster-Tools von Google aufgerufen hat, klickt man auf seine Webseite, die man ja zuvor hinzugefügt hatte. Auf der linken Seite sind dann zahlreiche Links.
Unter "Google Labs" ist dann der Unterpunkt "Abruf wie beim Googlebot", wo man seine Seite aufrufen kann wie, Google sie sieht. Allerdings wird nur der Quelltext angezeigt, den man aber bspw. mit nachfolgender Seite umsetzen kann.
http://www.mywebra.net/TP-Samples/codebox.html
Leider steht einem nur ein Kontingent von 50 Aufrufen zur Verfügung. Bei Erreichen erscheint oben die Meldung: "Ihr wöchentliches Kontingent an Anfragen wurde überschritten. Versuchen Sie es in einigen Tagen erneut."
Eine andere bessere Lösung ist es deswegen, dass man den Webbrowser Mozilla FireFox so einstellt, dass er alle Seiten so aufruft, wie sie von Suchmaschinen gesehen werden. Dies kann man dann natürlich auch wieder rückgängig machen.
Hierzu ruft man über die Adresszeile about:config auf und sucht dann nach useragent, indem man dieses Wort in die Zeile darüber einfügt. Von den Treffern klickt man mit Rechtstastenmausklick den Eintrag general.useragent.extra.firefox an und wählt im Kontextmenü die Option Bearbeiten.
Dann gibt man den Stringwert einer Suchmaschine an. Für Google ist dies Googlebot/2.1 oder Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html). Wenn man auf der Indexseite des phpBb3 auf "Wer ist online?" klickt, kann sehen, mit welcher Browserkennung (User Agent) Suchmaschinenbots jeweils im Forum unterwegs sind.
Falls zur Zeit keiner "vor Ort" ist, kann man einfach im Adminbereich unter >Spiders/Robots - Ändern - Agenten-Übereinstimmung< nachschauen, welche Suchmaschine jeweils welche Kennung hat, und sich eine aussuchen.
Diese Einstellung kann man einfach wieder rückgängig machen, indem man im FireFox wieder about:config aufruft, general.useragent.extra.firefox mit der rechten Maustaste anklickt und 'Zurücksetzen' wählt.
http://hannes-schurig.de/24/11/2009/surfen-wie-ein-google-bot
http://www.suchtwolke.de/2008/01/25/wie-gebe-ich-mich-als-google-bot-aus
Zudem habe ich eine Begrüßung für Bots eingebaut. Hierzu in der Datei styles/prosilver/template/index_body.html über "<!-- IF S_DISPLAY_SEARCH or (S_USER_LOGGED_IN and not S_IS_BOT) -->
<ul class="linklist">" beispielsweise nachfolgende Begrüßung einfügen! Falls nämlich mal ein User seine Homepage in seine Kennung angibt, weiß er dann, dass er diese nur ohne http anzugeben braucht, um normale Rechte für das Forum zu haben.
Hierzu ruft man über die Adresszeile about:config auf und sucht dann nach useragent, indem man dieses Wort in die Zeile darüber einfügt. Von den Treffern klickt man mit Rechtstastenmausklick den Eintrag general.useragent.extra.firefox an und wählt im Kontextmenü die Option Bearbeiten.
Dann gibt man den Stringwert einer Suchmaschine an. Für Google ist dies Googlebot/2.1 oder Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html). Wenn man auf der Indexseite des phpBb3 auf "Wer ist online?" klickt, kann sehen, mit welcher Browserkennung (User Agent) Suchmaschinenbots jeweils im Forum unterwegs sind.
Falls zur Zeit keiner "vor Ort" ist, kann man einfach im Adminbereich unter >Spiders/Robots - Ändern - Agenten-Übereinstimmung< nachschauen, welche Suchmaschine jeweils welche Kennung hat, und sich eine aussuchen.
Diese Einstellung kann man einfach wieder rückgängig machen, indem man im FireFox wieder about:config aufruft, general.useragent.extra.firefox mit der rechten Maustaste anklickt und 'Zurücksetzen' wählt.
http://hannes-schurig.de/24/11/2009/surfen-wie-ein-google-bot
http://www.suchtwolke.de/2008/01/25/wie-gebe-ich-mich-als-google-bot-aus
Zudem habe ich eine Begrüßung für Bots eingebaut. Hierzu in der Datei styles/prosilver/template/index_body.html über "<!-- IF S_DISPLAY_SEARCH or (S_USER_LOGGED_IN and not S_IS_BOT) -->
<ul class="linklist">" beispielsweise nachfolgende Begrüßung einfügen! Falls nämlich mal ein User seine Homepage in seine Kennung angibt, weiß er dann, dass er diese nur ohne http anzugeben braucht, um normale Rechte für das Forum zu haben.
- Code: Alles auswählen
<!-- IF S_IS_BOT -->Because your user agent @, bot, www, http, crawler oder Validator contains, here you have only bot rights.<br />Weil Deine Browserkennung @, bot, www, http, crawler oder Validator enthält, hast Du hier nur Botrechte.<br /><br /><!-- ENDIF -->