Anaconda vs Miniconda

| | ,

Para ejecutarse, muchas librerías o paquetes científicos (como tensorflow, por ejemplo) dependen de versiones específicas de otros paquetes. A menudo, las versiones de los paquetes que hemos utilizado para desarrollar un proyecto en particular, no nos sirven para desarrollar otro proyecto distinto. Como es inviable utilizar a la vez distintas versiones de un mismo paquete sin aislar unas de otras, lo normal es recurrir a entornos virtuales. Esto nos ayuda a garantizar que cada versión de cada paquete tenga todas las dependencias que requiere y funcione correctamente. Y aquí es donde entra en juego Anaconda.

Anaconda es un administrador de paquetes, un administrador de entornos, una distribución de data/science de Python/R y una colección de más de 7500 paquetes de código abierto.

Es decir, Anaconda nos permite llevar un control de los entornos virtuales que hemos creado y de los paquetes (y versiones) que hemos instalado en cada uno de ellos. Además, nos permite instalar Python cómodamente, junto a un enorme número de aplicaciones y paquetes típicos de Data Science.

Cuando instalas Anaconda, estás instalando Python, el gestor conda, la interfaz gráfica de usuario (desde la cual puedes gestionar paquetes, entornos y aplicaciones sin tocar una sola línea de código) y más de 250 paquetes de uso frecuente, todo ello a la vez.

Por tanto, Anaconda es en realidad una plataforma o conjunto de herramientas típicas para trabajar en proyectos de Data Science. Puedes consultar la lista de paquetes disponibles en la última versión de Anaconda en el siguiente enlace: Anaconda package lists — Anaconda documentation. Más allá de esta colección de paquetes de código abierto, gracias al gestor conda pueden instalarse de forma directa más de 1,5K paquetes del repositorio público de Anaconda y más de 20k paquetes de otros canales (repositorios de paquetes, sitios privados de nuestro ordenador o lugares públicos de la web donde se encuentran los paquetes disponibles para ser descargados y/o instalados) comunitarios, como Conda-forge y bioconda.

Claro, todo esto tiene un coste. Y no, no hablo de precios, ya que Anaconda tiene una versión individual que es 100% gratuita. Me refiero a que, al incluir tantas cosas, ¡ocupa bastante! Asegúrate de que tienes, por lo menos, 3GB libres de espacio en el disco duro.

Y entonces, ¿cuál es la diferencia con Miniconda?

A la vista del nombre, te lo estarás imaginando. Miniconda es una alternativa a Anaconda mucho más ligera. Básicamente, Miniconda es solamente el gestor conda junto a sus dependencias. Es decir, la distribución de Anaconda trae ya paquetes precargados, mientras que la distribución de Miniconda solo incluye el sistema de administración y no viene con ningún paquete precargado. Por tanto, el instalador de Miniconda es mucho más pequeño y solo necesita unos 400 MB de espacio.

¿Cuál de las dos distribuciones elegir?

Por regla general, si tienes espacio de sobra en el ordenador, te diría que instalases la versión completa de Anaconda. Trae ya de serie muchas cosas que te pueden venir muy bien. Si no es el caso, entonces no te lo pienses e instala Miniconda. Siempre puedes ir añadiendo después lo que te haga falta. Por ejemplo, al instalar Miniconda no tendrás disponible en un primer momento la interfaz gráfica de usuario, pero es algo que tiene fácil solución: tan simple como instalarla desde la terminal de comandos de conda con el comando conda install anaconda-navigator. Si no tienes claro lo que te puede aportar esta interfaz, échale un vistazo al siguiente vídeo, en el que te enseño a gestionar paquetes y entornos sin tocar nada de código:

Después de haber visto las diferencias entre Anaconda y Miniconda, ¿crees que merece la pena instalar la versión completa de Anaconda? ¿Utilizas ya alguna de las dos?

Anterior

Todo sobre el Data Science

Combinando estructuras de datos con pandas

Siguiente

Deja un comentario