Herramienta Recoll como servidor para búsquedas full-text.

Herramienta Recoll como servidor para búsquedas full-text.

Fuente:

http://www.lesbonscomptes.com/recoll/

Recoll encuentra palabras clave dentro de los documentos y también nombres de archivos.

  • Hay versiones disponibles para Linux y MS Windows .
  • Un front-end WEB con características de vista previa y descarga puede reemplazar o complementar la GUI para uso remoto.
  • Puede buscar la mayoría de los formatos de documentos . Es posible que necesite aplicaciones externas para la extracción de texto .
  • Puede llegar a cualquier lugar de almacenamiento: archivos, miembros de archivo, archivos adjuntos de correo electrónico, manejo transparente de la descompresión.
  • Un clic abrirá el documento dentro de un editor nativo o mostrará una vista previa de texto aún más rápida.
  • El software es gratuito, de código abierto y está licenciado bajo la GPL.
  • Las características detalladas y los requisitos de la aplicación para los tipos de documentos admitidos.

En esta entrada vamos a configurar Recoll en Debian usando el servidor web Apache

  • Instalar recoll

sudo apt-get install recoll python-recoll

  • Instalar apache y el modulo mod-wsgi

sudo apt-get install apache2 libapache2-mod-wsgi

  • Clonar el proyecto recoll-webui-recoll desde

https://github.com/koniu/recoll-webui

NOTA:   Clona el repositorio github, o extrae la instalación maestra de tar, y muévela a  la ruta /var/www/html/recoll-webui-master/

Ten en cuenta que su usuario tenga permisos de lectura/ejecución.

Edita /etc/apache2/mods-enabled/wsgi.conf, agrega lo siguiente al final de la sección «IfModule».

Cambia el usuario y grupo  ( dockes en el ejemplo) teniendo cuidado de que él es el propietario del índice ( .recoll está en su directorio de inicio).

WSGIDaemonProcess recoll user=dockes group=dockes \
    threads=1 processes=5 display-name=%{GROUP} \
    python-path=/var/www/recoll-webui-master
WSGIScriptAlias /recoll /var/www/recoll-webui-master/webui-wsgi.py
<Directory /var/www/recoll-webui-master>
        WSGIProcessGroup recoll
        Order allow,deny
        allow from all
</Directory>

Nota: la aplicación WebUI de Recoll es en su mayoría de subproceso único, por lo que es de poca utilidad (y en algunos casos puede ser contraproducente) para especificar varios subprocesos en la línea WSGIDaemonProcess. Especifique múltiples procesos en su lugar para poner varias CPU a trabajar en solicitudes simultáneas.

A continuación, ejecute lo siguiente para reiniciar Apache:

sudo systemctl restart apache2

La WebUI de Recoll ahora debería estar accesible en http://localhost/recoll/

NOTA: Tenga cuidado de que necesita un / al final de la URL utilizada para acceder a la búsqueda (use: http://my.server.com/recoll/, no http://my.server.com/recoll ), archivos de otro modo aparte del guión en sí no se encuentran (la página se ve extraña y la búsqueda no funciona).

Precaución: NO HAY CONTROL DE ACCESO. CUALQUIER PERSONA CON ACCESO A LA RED DONDE SE ENCUENTRA EL SERVIDOR PUEDE RECUPERAR CUALQUIER DOCUMENTO.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Entrada anterior Consultas en MySQL en forma de lista
Entrada siguiente Diseño de herramientas Web como objeto de aprendizaje para la Facultad De Medicina Torreón