Fuente:
http://www.lesbonscomptes.com/recoll/
Recoll encuentra palabras clave dentro de los documentos y también nombres de archivos.
- Hay versiones disponibles para Linux y MS Windows .
- Un front-end WEB con características de vista previa y descarga puede reemplazar o complementar la GUI para uso remoto.
- Puede buscar la mayoría de los formatos de documentos . Es posible que necesite aplicaciones externas para la extracción de texto .
- Puede llegar a cualquier lugar de almacenamiento: archivos, miembros de archivo, archivos adjuntos de correo electrónico, manejo transparente de la descompresión.
- Un clic abrirá el documento dentro de un editor nativo o mostrará una vista previa de texto aún más rápida.
- El software es gratuito, de código abierto y está licenciado bajo la GPL.
- Las características detalladas y los requisitos de la aplicación para los tipos de documentos admitidos.
En esta entrada vamos a configurar Recoll en Debian usando el servidor web Apache
- Instalar recoll
sudo apt-get install recoll python-recoll
- Instalar apache y el modulo mod-wsgi
sudo apt-get install apache2
libapache2-mod-wsgi
- Clonar el proyecto recoll-webui-recoll desde
https://github.com/koniu/recoll-webui
NOTA: Clona el repositorio github, o extrae la instalación maestra de tar, y muévela a la ruta /var/www/html/recoll-webui-master/
Ten en cuenta que su usuario tenga permisos de lectura/ejecución.
Edita /etc/apache2/mods-enabled/wsgi.conf, agrega lo siguiente al final de la sección «IfModule».
Cambia el usuario y grupo ( dockes en el ejemplo) teniendo cuidado de que él es el propietario del índice ( .recoll está en su directorio de inicio).
WSGIDaemonProcess recoll user=dockes group=dockes \
threads=1 processes=5 display-name=%{GROUP} \
python-path=/var/www/recoll-webui-master
WSGIScriptAlias /recoll /var/www/recoll-webui-master/webui-wsgi.py
<Directory /var/www/recoll-webui-master>
WSGIProcessGroup recoll
Order allow,deny
allow from all
</Directory>
A continuación, ejecute lo siguiente para reiniciar Apache:
sudo systemctl restart apache2
La WebUI de Recoll ahora debería estar accesible en http://localhost/recoll/
NOTA: Tenga cuidado de que necesita un / al final de la URL utilizada para acceder a la búsqueda (use: http://my.server.com/recoll/, no http://my.server.com/recoll ), archivos de otro modo aparte del guión en sí no se encuentran (la página se ve extraña y la búsqueda no funciona).
Precaución: NO HAY CONTROL DE ACCESO. CUALQUIER PERSONA CON ACCESO A LA RED DONDE SE ENCUENTRA EL SERVIDOR PUEDE RECUPERAR CUALQUIER DOCUMENTO.