Módulo de segmentación semántica utilizando foundation models con imágenes ópticas
Objetivo GeneralLa reconstrucción 3D es el proceso de obtener una representación tridimensional de un objeto, escena o entorno a partir de datos bidimensionales, como imágenes, videos o nubes de puntos. En este Proyecto de Investigación y Desarrollo (PID) se propone desarrollar un sistema de reconstrucción 3D basado en la correspondencia entre imágenes, aprovechando las relaciones geométricas presentes en ellas.
Desarrollo de modelos de segmentación semántica y aprendizaje profundo para asociar regiones contextuales, permitiendo reconstrucciones temáticas y localización de entidades en imágenes ópticas. Se emplearán algoritmos de aprendizaje automático, los cuales permitirán optimizar la segmentación, la detección de correspondencias y mejorar la reconstrucción de superficies complejas, favoreciendo aplicaciones en áreas como diagnóstico médico, robótica móvil, vehículos autónomos, mapeo con drones, digitalización de patrimonio arqueológico y cultural así como la inspección automatizada en ambientes industriales.
Programación de algoritmos, etiquetado y confección del set de datos, entrenamiento y evaluación de modelos con arquitecturas de aprendizaje automático. Publicar un trabajo en un congreso nacional.
- Conocimientos de Python.
- (deseable) Aprendizaje Automático.
- (deseable) Visión por computadora.
- (deseable) Entrenamiento de modelos con Keras, TensorFlow o PyTorch.