Visión Artificial con Google Colab

Visión Artificial con Google Colab
Comenzar el Curso
¿Por qué Google Colab?
Google Colab es un entorno de Jupyter Notebook en la nube que permite ejecutar Python sin configuración.
GPU Gratis
Acceso a NVIDIA T4 (esencial para Deep Learning).
Preinstalado
Viene con OpenCV, TensorFlow y PyTorch.
Colaboración
Se guarda en Drive y se comparte como un Google Doc.
Configuración del Entorno (La GPU)
Para tareas de visión artificial (especialmente redes neuronales), la CPU no es suficiente.
1
Cambiar tipo de entorno
Ve a Entorno de ejecución > Cambiar tipo de entorno de ejecución.
2
Seleccionar GPU
Selecciona T4 GPU (o la disponible).
3
Verificar con:
Ejecuta el siguiente comando en Python:
!nvidia-smi
Librerías Esenciales
Las herramientas que usaremos en casi todos los proyectos:
OpenCV (cv2)
La navaja suiza para procesar imágenes.
NumPy
Para manejar las imágenes como matrices numéricas.
Matplotlib
Para visualizar resultados dentro del notebook.
PIL
Para manipulación básica de archivos de imagen.
Carga de Datos (Imágenes)
Hay tres formas comunes de llevar tus imágenes a Colab:
Subida directa
Usar el icono de "Carpeta" a la izquierda.
Google Drive
from google.colab import drive drive.mount('/content/drive')
Wget/Git
Clonar repositorios con datasets mediante !git clone.
El Concepto de Imagen Digital
En visión artificial, una imagen es una matriz (o tensor).
Tipos de Imagen
Gris
Matriz 2D (Alto x Ancho).
Color (RGB)
Matriz 3D (Alto x Ancho x 3 Canales).
⚠️ Importante
OpenCV lee por defecto en BGR, hay que convertirlo a RGB para que se vea bien en Matplotlib.
Recuerda siempre convertir el espacio de color al trabajar con OpenCV y Matplotlib juntos.