Wie verwenden Hacker Google?

Es klingt schon fast etwas anmaßend eine Firma wie Google zum Hacken zu verwenden. Dabei geht es nicht um das Kapern von Servern des Internetgiganten und deren Missbrauch für Denial of Service Angriffe.

Das Ziel ist damit nicht der direkte Angriff, denn wenn man sich die 7 Stufen des Angriffs auf IT Systeme anschaut – Hier geht’s zum Artikel – so hilft Google vor allem bei Punkt 1: Aufklärung. Jeder erfolgreiche Angriff muss eine vorherige Aufklärung inne haben, die möglichste alle Fälle, die auftreten können aufdeckt. Ein Angreifer kann sich damit perfekt vorbereiten. Aber vorher ein kurzer Schwenk in Richtung Suchmaschinen, denn das ist das Tool der Wahl für diesen Artikel.

Wie funktioniert Google?

Google, so wie auch jede andere Suchmaschine hat große Rechenzentren, die Daten speichern und sich auf dem Weg in’s Netz machen, um noch mehr Daten zu finden. Diese Daten werden mit Hilfe geeigneter Software interpretiert. Das dadurch gespeicherte Wissen können wir Menschen, aber auch jede andere Maschine abfragen. Die Details machen das ganze natürlich viel komplexer, denn es geht um Algorithmen und wie die Daten nach Wertigkeiten sortiert werden. Aber das ist ein eigenes Thema. Strukturiert dargestellt geschieht folgendes:

  • Webcrawler machen sich auf die Suche nach Webseiten, in dem bereits bekannt Seiten angesurft werden
  • Diese Webseiten enthalten unter Umständen Links, denen der Crawler weiter folgt
  • Es werden alle für den Crawler notwendigen Informationen von jeder Seite gespeichert, denn jede Webseite wird gründlich untersucht

Dadurch hat Google einen unglaublichen Informationsschatz, der für die Öffentlichkeit durchsuchbar ist. Ein sehr wichtiger Punkt ist vor allem die Semantik, die Google herstellt. Webseiten werden tatsächlich maschinell gelesen und ausgewertet, so dass Google genau weiß wonach wir suchen, wenn wir bestimmte Begriffe eintippen.

Erweiterte Google Suche

Für gewöhnlich reicht es aus mit ganz normalen Suchbegriffen zu arbeiten. Die meisten Menschen, mich eingeschlossen, verwenden keine speziellen Kommandos oder Zeichen, aber genau hier liegt der Unterschied zur gezielten Informationsgewinnung. Und damit wohl auch der Schlüssel zum erfolgreichen Angriff auf ein IT System.

Wie kann ich mich gegen die Google Suche wehren?

Leider nicht besonders. Es gibt zwar die Möglichkeit einem Bot zu sagen, er solle die Webseite ignorieren, aber das kann er durchaus ignorieren. Folgende Abwehrmaßnahmen sind einen Versuch wert.

Botabwehr über HTML

Im sogenannten Kopf-Bereich einer HTML Seite können META Tags verwendet werden, um bestimmte Informationen über seine Webseite anzuzeigen. So lässt sich zum Beispiel mit folgendem HTML Code ein Bot darauf hinweisen, er soll die Webseite ignorieren:

<meta name=”robots” content=”noindex,nofollow”>

In wie weit die Maßnahme greift kann ich persönlich nicht beurteilen, aber Schaden kann es nicht, wenn man zumindest eine bestimmte Anzahl an Bots von der Webseite fernhält.

Botabwehr über robots.txt

Zusätzlich lässt sich eine Datei im Webspace erstellen, am besten im gleichen Verzeichnis, wie die index.html, in welcher jedem Bot Anweisungen erteilt werden, die er zwar ignorieren kann, aber nicht muss. Dabei handelt es sich um die robots.txt, die folgenden Inhalt haben muss, damit eine komplette Webseite nicht “besuchbar” ist:

User-Agent: *

Disallow: /

Man kann natürlich auch nur bestimmte Bots sperren, wenn man deren Signatur kennt, oder nur bestimmte Webseiten. Das Symbol / steht hier eben für alle Webseiten, aber es können auch weitere Unterordner definiert werden.

Wie finde ich wertvolle Informationen bei Google? (Google Dorks)

Dieser Abschnitt des Beitrags ist etwas dichter mit Informationen gepackt, denn die Google Suche liefert sehr viele unterschiedliche Einstellungen. Fangen wir aber ganz leicht an.

Wie “googelt” man richtig?

Als Penetrationstester muss ich häufig Webseiten prüfen. Statt einen Bot über alle Seiten laufen zu lassen vertraue ich teilweise auch auf den Google Bot. Der kann mir mit folgenden Befehlen schon helfen, einfach bei Google eintippen (Ziel Webseite: andresilaghi.com):

site:andresilaghi.com ~password “american express” -old 2014..2016

Am besten ich zerlege den Suchbefehl und erläutere die Details:

Teil 1 – site:andresilaghi.com

Damit teile ich Google mit, dass ich nur Webseiten in den Ergebnissen sehen möchte, die zu dieser Webseite gehören. Andere Domains werden ignoriert.

Teil 2 – ~password

Ein normaler Suchbegriff ohne das ~ Symbol würde lediglich nach dem Wort “password” suchen. Mit dem Tilde Symbol sagen wir dem Bot, dass er sinnverwandte bzw. verknüpfte Wörter mit berücksichtigen soll (secret, passwords usw.).

Teil 3 – “american express”

Diese Suchart ist denke ich vielen ein Begriff. Mit den Hochkommata kann ich eine Verknüpfung zwischen zwei Worten definieren. In diesem Fall möchte ich genau diesen Begriff. Mich interessiert weder “american” noch “express”, aber beides zusammen wäre interessant.

Teil 4 – -old

Mit dem Minus Symbol möchte ich Elemente aus den Ergebnissen herausfiltern, die irgendwie mit dem Begriff “old” markiert werden. Das Ziel der Suche scheint ja stark auf Kreditkarten Informationen ab zu zielen. Alte und nicht mehr gültige Daten interessieren mich nicht und ich hoffe der User war so freundlich und hat diese mit dem Wörtchen “old” markiert.

Teil 5 – 2014..2016

Ich möchte wirklich nur aktuelle Daten haben und gehe davon aus, dass mein Ziel hin und wieder die Kreditkarte wechselt. Es gibt ja laufend neue Angebote mit Boni und die möchte man sich nicht entgehen lassen. Also möchte ich nur Ergebnisse, die in den letzten 2 Jahren aufgezeichnet worden sind.

Wie googelt man noch besser?

Es gibt noch einiges zu lernen, was die Google Suche angeht. In diesem Artikel werden nicht alle Möglichkeiten aufgezählt, da es einfach viel zu viele davon gibt. Da musst du kreativ sein und dir selbst überlegen, wie du bestimmte Informationen aus Google herauskitzelst. Es macht ja auch Spaß. Schauen wir uns aber den nächsten Lernschritt an:

site:andresilaghi.com filetype:pdf intitle:*Bank* OR intitle:*kasse

Teil 1 – site:andresilaghi.com

Das überspringe ich, da du oben bereits sehen kannst, was dieser Teil genau bewirkt.

Teil 2 – filetype:pdf

Jetzt wird es interessant. Als Angreifer möchte ich wissen, welche Dokumente aus Versehen auf den Webspace gekommen sind. Gibt es PDFs? Docx oder gar Xlsx mit brisanten Informationen? (Tipp: Nutzt diese Suchen auf eure Seiten um heraus zu finden, was ihr alles “aus versehen” publiziert!)

Teil 3 – intitle:*Bank OR intitle:*kasse

Ich behaupte im Titel, der in de Tabs oder in der Fensterleiste erscheint, stehen Worte wie “Deutsche Bank”, oder “Commerz Bank”, oder gar “Sparkasse”. Deswegen sage ich Google mit “intitle”, dass mich nur diese Dokumente interessieren. Mit dem logischen “oder” kann ich die Suche verfeinern, so dass ich nicht nur Banken sondern auch diverse Kassen mit in die Ergebnisse aufnehmen möchte.

Fazit

Diese Techniken können selbstverständlich für Angriffe verwendet werden, aber sie sind ein unerlässliches Mittel im Kampf gegen eben solche Angriffe. Prüft einfach intensiv eure nach außen exponierten Webseiten und schaut mal, was alles Google bereits über euch weiß. Ihr werdet erstaunt sein, wie viele Informationen zum Teil offen im Internet liegen. Angefangen bei irgendwelchen PDFs und weiter zu ganzen Passwortlisten in Excel (!). Kein Passwortschutz nein, wozu auch :-)

Berichtet mir von euren Erlebnissen mit der erweiterten Google Suche! Ich freue mich darauf.

Bücher zu diesem Thema

Beitragsbild arsp_064 von Anthony Ryan Creative Commons CC-BY SA 2.0

Artikel teilen:

4 Gedanken zu „Wie verwenden Hacker Google?

  • 4. November 2016 um 20:18
    Permalink

    Hallo André, danke für deinen tollen und aufschlussreichen Artikel. Ganz interessant bei der Google Suche für Angriffe ist auch immer die folgende:
    intitle:”index of” +etc+passwd
    Es ist erstaunlich, wie schnell man hier nicht geschützte Passwort Files findet, welche man editieren kann. Auch für den WS FTP Client geht das ähnlich.
    filetyp:ini WS_FTP PWD
    Ist schon sehr erstaunlich wie leicht das teilweise geht! Wichtig ist hierfür das Bewusstsein zu schaffen, dann gibt man vielleicht auch wesentlich mehr acht.

    Antwort
    • 4. November 2016 um 21:51
      Permalink

      Hallo Markus,

      gerne doch. Du hast recht, es gibt sehr viele Möglichkeiten diese Google Dorks zu verwenden, um ganz gezielt Informationen zu finden. Vielleicht ganz aufschlussreich noch folgende Webseite, die Ideen liefert: https://www.exploit-db.com/google-hacking-database/

      Dein Tipp bezüglich WS FTP Client könnte da gut rein passen :-)

      Viele Grüße
      André

      Antwort
  • 5. November 2016 um 13:34
    Permalink

    Hallo,
    das ist ja ein sehr interessante Seite. Die kannte ich gar nicht! Ich habe diese Sachen mal im Buch: Netzwork Hacking gelesen.

    Antwort
    • 20. November 2016 um 13:12
      Permalink

      Hallo Markus und danke für den Kommentar!

      Man kann natürlich seine eigenen Seiten damit absichern, aber auch viel schlechtes damit machen :-) Das Unwissen von anderen ausnutzen beispielsweise. Trotz allem ist es für Live Hacking Events uvm. immer ein wirkungsvolles Netzwerk.

      Viele Grüße
      André

      Antwort

Kommentar verfassen