Il deep web è un termine generico per le parti di Internet non completamente accessibili utilizzando i motori di ricerca standard come Google, Bing e Yahoo. I contenuti del deep web spaziano da pagine che non sono state indicizzate dai motori di ricerca, siti a pagamento, database privati e dark web.
Ogni motore di ricerca utilizza i bot per eseguire la scansione del Web e aggiungere i nuovi contenuti che trova all’indice del motore di ricerca. Non si sa quanto sia grande il deep web, ma molti esperti stimano che i motori di ricerca eseguano la scansione e l’indicizzazione di meno dell’1% di tutti i contenuti a cui è possibile accedere su Internet. Il contenuto ricercabile del Web viene definito Surface Web.

Gran parte del contenuto del deep web è legittimo e di natura non criminale. I contenuti del deep web includono messaggi e-mail, messaggi di chat, contenuti privati su siti di social media, estratti conto bancari elettronici, cartelle cliniche elettroniche (EHR) e altri contenuti accessibili in un modo o nell’altro su Internet.
Qualsiasi sito Web protetto da paywall, come il testo di articoli di notizie o siti di contenuti educativi che richiedono un abbonamento, viene bloccato anche dai bot dei motori di ricerca. Anche i siti a pagamento come Netflix non vengono sottoposti a scansione dai bot.
Per questo motivo, ci sono alcuni vantaggi nel deep web. Per cominciare, gran parte dei contenuti è irrilevante e renderebbe le ricerche molto più difficili. E c’è anche un problema di privacy; nessuno vorrebbe che i bot di Google scansionassero le loro visualizzazioni Netflix o l’account Fidelity Investments.
Come accedere al deep web
Sebbene le informazioni non siano indicizzate dai normali motori di ricerca, spesso è comunque possibile accedervi. L’accesso ai contenuti infatti è relativamente sicuro e la maggior parte degli utenti di Internet lo fa continuamente. L’accesso a Gmail o LinkedIn o l’accesso al Wall Street Journal sono solo alcuni esempi di accesso ai dati su un sito deep web.