Parece ayer cuando empecé a escribir los 12 artículos sobre “Cómo crear tu propio Shodan“, el tiempo corre muy deprisa. Un formato con el que me sentí muy cómodo, un modo tutorial. Hace unas semanas publicamos en el blog un artículo que exponía toda la documentación escrita y las charlas que se expusieron sobre el tema. Os dejo un enlace por si os interesa.

Cómo crear tu propio Shodan y llamarlo Shodita.

POST del blog de QuantiKa14.

En el último meetup de Hacking Sevilla ya realicé una demostración del bot ,no en pleno funcionamiento, pero quedó clara la idea. Evidentemente con varios mátices que mejorar. En la charla comenté cómo lo había desarrollado y su bajo nivel de dificultad para crear un proyecto de este tipo.

En esta ocasión me gustaría enseñaros cómo crear una aplicación en Python que funcione como motor de búsqueda para páginas webs .onion.

Foto de la intervención de Jorge Coronado en Ronda de Hacking III, en el bar de Triana “Enigma – Copas”.

https://www.meetup.com/es-ES/hacking-sevillaQK14/

En la red Tor podemos encontrar este tipo de páginas con un dominio. Sin embargo, podéis observar que todos terminan en “.onion” y que no podremos acceder con un navegador convencional. Para ello, necesitaremos estar conectados a la red Tor.

¿Cómo nos conectamos a la red Tor?

Existen diversos blogs y tutoriales de cómo hacerlo. No obstante, si te interesa independientemente de este artículo cómo conectarte. Te recomendamos el siguiente enlace:
https://www.testdevelocidad.es/redes/conectarse-la-red-tor/

Recuerda que, en nuestro caso, nos conectaremos usando Python. Lo veremos más adelante.

¿Qué fuentes de datos vamos a usar?

El potencial de nuestra aplicación dependerá de la capacidad de rastrear páginas y su tratamiento para etiquetarlas. Por ello, usaremos diferentes formas de obtener páginas .onion. Algunas de ellas son:

  1. Usaremos la API de DarkSearch que actualmente tiene más de 450 mil páginas webs indexadas. Será una línea de resultados muy interesantes y que nos hace gran parte del trabajo.
  2. De igual manera que DarkSearch, usaremos también la API de IntelX.io, sin embargo, a diferencia del anterior, será de pago. Nos costará 99,00 € al mes realizar peticiones de forma ilimitada.
  3. Crearemos un crawler para hacer minería de texto. Buscará de forma recursiva URLs que terminen en .onion y las indexará.

¿Qué recursos vamos a necesitar?

En primer lugar, necesitaremos un ordenador conectado a Internet. Será necesario tener instalado Python y MongoDB. En el caso de querer usar intelX deberemos comprar la API de pago. Por lo cual, en resumen, necesitaremos:

  • Ordenador con Python y MongoDB instalado. Recomendamos Linux para mayor facilidad a la hora de instalar las librerias
  • API de pago de IntelX. Solo en el caso de querer usarlo
  • Seguramente el crawler realizará muchas peticiones, causando que nos bloqueen en muchas plataformas webs. Por ello, es nada recomendable usar la IP de nuestra casa

Continuara…

undefined

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.