Wenn Social Media und Google nicht mehr reichen, um Kandidaten(-Infos) zu finden, gibt es immer noch eine weitere Möglichkeiten: Im Deep Web suchen. Denn XING und Linkedin sind derzeit im Social Recruiting und Sourcing zwar die Hauptplattformen, aber bereits heute suchen immer mehr Recruiter und Sourcer Infos auch in Google. Sie “googeln” Kandidaten(-Infos). Aber selbst bei professionellen Sourcing-Methoden wie der X-Ray Suche (auf deutsch Röntgentechnik, mehr hier: Was ist die X-Ray Suche oder Röntgen-Methode?), begrenzt Googles Algorithmus (u.a. technisch) die Möglichkeiten. Sie durchsuchen nie das ganze Web, wenn Sie googeln. Dieser Blogpost wirft einen Blick in Ihre Zukunft und zeigt Ihnen neue Möglichkeiten, wie Sie Kandidaten im Deep Web finden können.
Inhaltsverzeichnis
- Der Unterschied zwischen Deep Web, Dark Web und Surface Web
- Definitionsversuche der Web-Bereiche
- Wo beginnt das Deep Web?
- Der einfachste Weg zu Deep Web Informationen: Informations-Datenbanken
- Big Data und Informations-Explosion
- Wie komme ich selbst ins Deep Web?
- Was ist dieser “Zwiebel-Router” TOR?
- Deep Web Suchmaschinen
- Haben Sie jemals daran gedacht, Kandidaten via Deep Web oder Dark Web zu sourcen?
- DEEP WEB SOURCING HACK 1:
- DEEP WEB SOURCING HACK 2:
- Mehr Infos zu Recruiting und Sourcing im Dark Web und Deep Web und ein paar Best-Practice Beispiele:
- Author
Der Unterschied zwischen Deep Web, Dark Web und Surface Web
Der Unterschied ist einfach erklärt. In der Realität existiert keine Grenze, ab der man vom Surface Web ins Deep Web gleitet. Ein simpler Unterschied ist: das Deep Web ist das, was Google und die wenigen anderen klassischen Suchmaschinen nicht indexiert haben (also nicht in ihren “Speicher” übernommen haben). Es sind die Seiten und Informationen, die im Web existieren und die über eine klassische Suche nicht erreichbar sind. Deep Web Beispiele sind z.B. Websites, auf denen man sich anmelden muss (von Foren bis gesicherten Bankkonten).
Aber das Deep Web ist nicht einfach nur “Hacking”. Im Gegenteil: Es existieren dort viele (alte) Websites z.B. von Personen oder Instituten, die kein Geld oder kleine Zeit hatten, diese irgendwann den modernen Standards anzupassen. Google “vergißt” diese dann oder nimmt sie einfach nicht ins Verzeichnis, z.B. weil sie nicht mobiloptimiert sind. Dann kann man sie auch nicht mit den besten Booleschen Befehlen und Sourcing Strings via Google & Co. finden. Übrigens: Dieser Technik kann man natürlich nachhelfen, also dafür sorgen, dass man nicht gefunden wird. Auch diese Seiten, die aus welchen Gründen auch immer, nicht gefunden werden sollen, sind im Deep Web. Laufen diese Websites nicht mal mehr über das normale Internet-Netzwerk, sondern über ein verstecktes Netz, dann sprechen wir über das Dark Web.
Definitionsversuche der Web-Bereiche
Sie besuchen jeden Tag zahlreiche Websites. Dieser Teil des Internets ist das Surface Web, das Sie über Suchmaschinen besuchen können. Aber dies ist nur ein kleiner Teil des Internets, nur ca. 4%.
Die überwiegende Mehrheit des Internets liegt im Deep Web. Einige Statistiken behaupten, dass das Deep Web geschätzt 500-mal größer als die Fläche des Webs ist. Ich denke, das kommt überhaupt nicht hin, das Deep Web ist viel, viel größer:
Alles, auf das die regulären Suchmaschinen (Google & Co.) nicht zugreifen können, aber (technisch) noch mit einem normalen Browser (Chrome, Firefox, Opera, Safari) erreichbar wären, wenn man eine passende URL hat/hätte, ist ein Teil des Deep Web (96 % des Webs!). Technisch sind die Seiten des Deep Web ein Bestandteil des großen Internet-Netzwerks. Nur sind sie so geschrieben oder gesichert, dass sie auf normalem Weg nicht in Google & Co. angezeigt und gefunden werden können.
Alles, was gezielt und damit aus einem bestimmten Grund unzugänglich für Standard-Web-Browser ist, ist das Dark Web. Das ist ein sehr kleiner Teil des Deep Webs, doch größer als das Surface Web (wird von Experten vermutet). Es ist nicht per se illegal, aber natürlich ein Eldorado für Menschen, die sich nicht an Regeln halten (wollen). Aber: Diese Regeln ändern sich ständig und sind auch pro Land unterschiedlich. Was bei uns in Deutschland legal ist, kann in Saudi-Arabien bereits illegal sein und zwingt Menschen ins Deep Web oder sogar ins Dark Web (hier ein Beispiel dafür).
Das folgende Video erklärt dies gut (ist leider in Englisch):
Wo beginnt das Deep Web?
Wenn schon niemand weiß, wie groß das Deep Web wirklich ist, kann Ihnen niemand sagen, ab wann das Deep Web wirklich beginnt. Es ist schließlich nur eine technische Art “Grenze” – durch Googles & Co.’s Algorithmen definiert. Sicherlich: Einige Daten werden geschützt oder versteckt, aber einige Websites können nicht durch die aktuelle Suchmaschinen-Technologie gecrawlt werden. Die Daten, die Sie im Deep Web finden können, sind schwer bis unmöglich via einfacher Suchmaschinen zu erreichen – und noch schwerer für Nicht-Profi-Googler zu finden. Aber viele dieser Websites und Informationen, besonders die, die nur aus technischen Gründen nicht direkt gefunden werden können, sind mit anderen Tools dennoch erreichbar.
Der einfachste Weg zu Deep Web Informationen: Informations-Datenbanken
Sie können zum Beispiel im Deep Web Firmendatenbanken, Adressbücher oder Personeninformationen erreichen, die nicht einmal bewußt versteckt wurden. Universitätsbibliotheken, Institute, Forschungsgemeinschaften haben oft ihre Infos ins Web gestellt, damit man sie findet, aber dabei nicht das Knowhow, wie man das “Gefunden werden” garantiert. Denn viele wissen gar nicht, dass ihre Website oder Teile ihrer Website im Deep Web liegen. Um zu helfen – aber auch um Geld damit zu verdienen gibt es sogenannte “Informations-Datenbanken“.
Meist mit bestimmten Zweck z.B. für Wissenschaftler, Journalisten oder einfach nur für Firmeninformationen. Science.gov oder FreeLunch sind Beispiele aus den USA für Wissenschafts-Informations-Datenbanken. Genios.de (Informationen zu Firmenbonität) ist z.B. eine deutsche “Informations-Datenbank” oder auch Creditreform als Wirtschaftsdatenbank. (mehr hier – sogar in deutscher Sprache – bei Wikihow: Durchsuchen des Deep Webs).
Big Data und Informations-Explosion
Jeden Tag wird das Deep Web tiefer und größer. Google, Baidu, Bing und alle Suchmaschinen verbessern täglich ihre Algorithmen, aber da diese Algorithmen zusätzlich lernende Systeme sind, trägt jeder, der online geht, bereits dazu bei, dass die Informations- und Datenflut steigt. Da das Internet immer mehr wächst, wird diese riesige Datenmenge, genannt Big Data zum Problem: Wie will man diese Flut indexieren, speichern – und dann wiederfinden und sogar analysieren? Kein Wunder, dass die Nachfrage nach (Big) Data Analysts, IT-Sicherheitsexperten aller Art und noch mehr Semantische Algorithmen Spezialisten weltweit explodiert.
Wie komme ich selbst ins Deep Web?
Das Tor ins Web überhaupt ist ein Browser – nur mit einem Browser kann man eine Website darstellen. Ohne Browser kommt man nicht ins Web und kann keine Websites anzeigen. Die gängigen Browser wie Chrome, Safari oder der Internet Explorer bzw. sein Nachfolger Edge verschmelzen derzeit mit den Suchmaschinen (hier mehr in unserem Blogartikel: Was ist der Unterschied zwischen Browser und Suchmaschine?), weil sie so besser tracken können. Ihr Ziel ist die sogenannte Personalisierung der Suchergebnisse. Durch das Tracken verändert sich aber nicht nur das persönliche Ergebnis, sondern auch immer das allgemeine Suchergebnis. Deshalb ist es notwendig, wenn Sie verborgene Informationen gezielt finden möchten, einen anderen Browser und eine andere Suchmaschine zu nützen.
Das Haupttool für den Besuch des Deep Web ist eine spezielle Software: The Onion Router (allgemein als TOR bekannt). TOR wahrt Ihre Anonymität und den Zugang zu den versteckten Informationen, wenn Sie über Tor eine Suchmaschine aufrufen, die im Deep Web finden können. Andersherum gesprochen: Ohne TOR (oder einen anderen Deep Web Browser) kommen Sie nicht (selbst) ins Deep Web!
Was ist dieser “Zwiebel-Router” TOR?
TOR (The Onion Router) ist eigentlich nur ein (Browser-)-Programm, das Ihnen ermöglicht, anonym im sogenannten TOR-Netz des Internets zu surfen. Dieses TOR- Netzwerk verbindet Millionen von PC’s, Server und Mobilgeräte, die vernetzt Informationen – ohne Googles & Co.’s Bewertung – zur Verfügung stellen. Dies bedeutet, dass Sie für Ihren Internet-Provider und andere unsichtbar online agieren. Sie senden dann keine Daten, aber können (soweit sie sich nicht anders outen) auch nicht erkannt werden. Andersherum gesprochen: Ihre Suchergebnisse z.B. mit Google sind also im Surface Web nie “neutral”. Und nur in Ausnahmefällen mit speziellen “privaten” Modi Ihrer Browser (und selbst da nicht mit allen “Privaten” Modi, denn es gibt viel zu viele Cookies und andere kluge Tracking-Tools, die auch das ignorieren (können)!) können Sie inkognito surfen. Aber selbst dann senden Sie immer Ihren Standort / Land im Surface Web.
Hier können Sie TOR herunterladen (auf das Bild klicken).
Sind Sie mit TOR im Web unterwegs, können Hacker, aber auch Onlinelinemarketer (also absolut kein Tracking) oder einfache Spione nicht feststellen, was Sie via Internet tun. Diese Anoymität erreichen Sie natürlich auch über Proxy-Server (hier mehr zum Einsatz von Proxys im Recruiting und Sourcing: HR-Hacking – Auf blockierte Websites über kostenlose Proxy-Server zugreifen), aber dann können Sie dieses TOR-Netzwerk nicht nützen. Und bleiben im Grunde nur im Surface Web.
Hinweis: Zugriff auf das TOR-Netzwerk ist so legal wie die Nutzung von Chrome oder Safari. Es legalisiert aber damit nicht die Handlungen und Ihre Aktivitäten, die Sie damit durchführen!
Deep Web Suchmaschinen
Mit TOR alleine kann man nicht wirklich gut suchen und finden. Es ist nur ein Browser. Deshalb muss eine Deep Web Suchmaschine zusätzlich her eingesetzt werden. Google in der realen Welt macht es uns bequem, wir sind an diese schöne Semantik gewöhnt. Doch das Suchen und Finden beginnt im Deep Web mühevoll mit dem Test geeigneter Suchmaschinen. Einer der Deep Web – Suchmaschinen ist Yippy.com – eine Meta-Suchmaschine, die die Ergebnisse von mehreren Deep Web und Surface Web Top-Suchmaschinen kombiniert. Aber da das Deep Web einem ständigen Wandel unterliegt, können Websites und Quellen, die bislang nicht als erfassbar galten, schon bald durch technische Neuerungen ihren Weg in den Index von Suchmaschinen finden. Und umgekehrt: Was heute immer indexiert wurde, findet sich unvermittelt morgen im Deep Web, weil Googles Algorithmen es “auslisten”.
Hinweis: Bitte beachten Sie, dass Links zu Deep Web Websites, die man mit TOR erreichen möchte, keine Endung . html oder andere Endungen haben, sondern immer .onion . Klicken Sie mit einem Surface Web Browser auf so einen Link, dann geht dieser ins Leere.
Um zu zeigen, dass die Verlinkung ins Deep Web möglich ist, aber nicht gleich funktioniert, hier ein Beispiel. Es gibt auch ein Deep Web Suchmaschinen Verzeichnis im Deep Web, da heißt The Hidden Wiki. Darin findet man eine große Anzahl von Suchmaschinen, die aber natürlich nicht an Googles “Qualität” heranragen. Man muss sie vor der Nutzung testen. Hier ist der Deep Web Link: http://zqktlwi4fecvo6ri.onion/wiki/index.php/Main_Page. Der Link sieht ähnlich aus, aber funktioniert nur korrekt, wenn Sie via TOR darauf klicken.
Haben Sie jemals daran gedacht, Kandidaten via Deep Web oder Dark Web zu sourcen?
Für Recruiter oder Sourcer: Tor ermöglicht das Finden von Inhalten sowohl von Webbsites, die Google & Co. aufgrund technischer Restriktionen wie Semantik oder “Nicht-Indexierung”, also auch vieler Passwort-geschützter Foren. Gerade in Fach-Foren gibt es sehr oft einen Bereich für Jobsuche mit der Bitte um Hilfe. Dieser ist vielfach ohne Anmeldung nicht möglich. Hier 2 Hacks zum Sourcing im Deep Web:
DEEP WEB SOURCING HACK 1:
Suchen Sie via TOR nach Themen-Foren und dann nach “Jobsuche” oder “Looking for a job” und Sie werden erstaunt sein, was Sie finden! Machen Sie aber dann nicht den Fehler und sprechen dort direkt an! Melden Sie sich offiziell im gefundenen Forum an und dann können Sie auch kontaktieren. Finden und Wissen, dass dieser Kandidat da ist, ist das eine. Kontaktieren oder Daten speichern stehen auf einem ganz anderen Blatt!
DEEP WEB SOURCING HACK 2:
Es gibt unendlich viele Websites von potentiellen Kandidaten, die gar nicht wissen, dass Google sie nicht indexiert. Es ist für private Personen oft einfach, eine eigene Seite zu erstellen, vielleicht war sie auch mal in Google gut auffindbar, aber die Algorithmen ändern sich ständig – und schwupp sind sie nicht mehr indexiert. Der Hack ist hier: Via TOR und entsprechender Suchmaschine nach “about me” oder “über mich” oder “Lebenslauf” oder “Mein Profil suchen”. Unglaublich, wie viele Websites Google nicht findet und man via TOR erreicht.
Hinweis: Die Sourcing Methode sind hier einfach die Natural Language Search – Die Boolesche Suche funktioniert mehr als selten in den Deep Web Suchmaschinen. Diese Deep Web Suchmaschinen kommen und gehen – meist gibt es sie nicht lange. Deshalb ist für diejenigen, die im Deep Web sourcen wollen, stetiges Versuchen mit Experimentierfreude und sehr viel Fleiß angesagt. Aber es lohnt sich. Versprochen!
ZWISCHENFAZIT
Machen Sie sich keine Illusionen: Das Surface Web ist ein Jahrmarkt der Eitelkeiten, in dem es um Markting geht und faktische Bedürfnisweckung. Gezielt zu suchen, wird jeden Tag schwerer. Unsere Neigung zu Bequemlichkeit, also den Ergebnissen der Suchmaschinen Glauben zu schenken, wächst jeden Tag – der Überinformation (Information Overload) sei Dank. Google “bevormundet” uns also bereits als private Personen, dies tun auch die semantischen Algorithmen der Social Media Portale – faktisch (teils gewollt, teils technisch bedingt). Der Router TOR öffnet uns eine Tür zu einer werbungs- und marktingfreien Welt. Es ist das angenehme zurück in die Zukunft: Sie werden Dinge dort sehen, von denn Sie dachten, dass Sie online nicht existierten und wieder finden, was Sie ebenso verloren glaubten.
Hinweis: Sie müssen im Deep Web keine Semantik überwinden, sondern können nach Keywords suchen. Doch der Weg ist sehr, sehr steinig – denn wir sind verwöhnt und haben das harte Suchen und Finden verlernt. Heute denken wir, alles muss einfach und schnell gehen. Ein Blick in unsere Sourcing/Personalbeschaffungszukunft zeigt: Das Erreichen von Kandidaten im Deep Web wird nicht nur für die Suche von Spezialisten immer mehr eine erfolgreiche Sourcing-Strategie werden (müssen). Denn diese Vorgehensweise ist der einzige Weg an Social Media, Google und dem ganzen Surface Web vorbei die restlichen 96 % des (eigentlichen) Webs zu durchsuchen!
Mehr Infos zu Recruiting und Sourcing im Dark Web und Deep Web und ein paar Best-Practice Beispiele:
Deep Web und Dark Web – Recruiting Best-Practice [ Teil 2]
und
Rethink HR in the Internet of Things (IoT) – Warum das Deep Web jetzt wichtig wird [Teil 3]
Naja so lala TOR usw. etc. Werden alle samt nach und nach geschlossen. Ergo Deep web, oder gar Darknet Suchmaschinen wie Grams…von wegen, gibt bessere Methoden in dem man sich selbst eine Suchmaschine mit dem entsprechenden-Hackingtools.in.:: GITHUB.:: und Source-Face…Downloads oder TOOLS..etc. es selbst zusammenstellst, und BASTELST:…Danke, nichtsdestotrotz, für diese kleine 3-geteilte Reportage…M.F.G:…Autodidakt-ER
[…] Erklärtes Lernziel der Session auf dem HR Innovation Day war auch: Nicht ungewollt ins Dark Web surfen. Das ist also der Teil des Deep Web, der komplett illegal und meist sogar kriminell ist. Barbara zeigte uns, für welche Suchen sich der Aufwand lohnt, im Deep Web zu surfen und wie man dort anonym bleibt. Natürlich sollten Sie nicht zum Spaß ins Deep Web surfen. Sie gab viele Sicherheitsratschläge. Zum Beispiel, dass sie, wenn Sie ins Deep Web gehen, sich aus allen Social Networks abmelden sollten. Ebenso ist es nicht klug „mit der Maus am Bildschirm zu lesen“ – Sie können durch Mausbewegungen enttarnt werden (wir neigen dazu, die Maus beim Lesen zu bewegen und dadurch Informationen dort Preis zu geben, wo entweder ein Cookie oder im Deep Web ein ungewünschter Hacker mit lesen) . Mehr zur Unterscheidung von Surface Web, Deep Web und Dark Web sowie Hacks zum Sourcing im Deep Web lesen Sie in unserem Blogbeitrag „Deep Web und Dark Web – Eine Chance für die Personalbeschaffung“). […]