Un investigador de la Universidad Pública de Navarra propone algoritmos de reconstrucción 3D basados en la visión estereoscópica que igualan los resultados de las mejores técnicas existentes y pueden ser ejecutados de manera más ágil en un ordenador.

Basque Research
|

15 febrero 2013 14:33

El investigador Leonardo de Maeztu Reinares, de la Universidad Pública de Navarra (UPNA), ha propuesto en su tesis doctoral algoritmos de reconstrucción 3D que pueden ser ejecutados de manera más ágil en un ordenador que los ya existentes, con resultados equivalentes.

Su trabajo se basa en la visión estereoscópica, una técnica para obtener imágenes tridimensionales y que requiere, para poder producir resultados precisos, una fuerte carga computacional y complejidad algorítmica. 

“El principio básico de la estereoscopía es el uso de dos o más cámaras que adquieren simultáneamente la misma escena desde diferentes posiciones, a semejanza de los ojos humanos –explica el investigador–. De esta manera, para cada instante de tiempo, se captan dos o más imágenes, que son comparadas entre sí para deducir la distancia de los objetos a las cámaras y captar así la profundidad de la que carece la fotografía clásica, que es bidimensional”.

Esta disponibilidad de dos perspectivas bidimensionales permite la reconstrucción tridimensional de la escena utilizando algoritmos de búsqueda de correspondencias entre imágenes.

Gracias al continuo incremento de la capacidad de cálculo de los ordenadores, cada vez es más habitual su uso para tareas de vigilancia, medición o inspección hasta hace poco reservadas a los seres humanos. Con tan solo una cámara fotográfica o de vídeo, los PC actuales pueden utilizarse para vigilancia de grandes multitudes, inspección de piezas al final de una cadena de producción o registro de matrículas de vehículos que atraviesan una zona.

El problema es que utilizar una sola cámara limita la capacidad de estos sistemas, ya que obtienen una representación bidimensional de un mundo tridimensional. Para resolverlo, existen los sensores tridimensionales; uno de los más utilizados, por su similitud con el sistema visual humano, incluye dos cámaras que graban la misma escena desde dos puntos de vista ligeramente separados.

“Durante los años 70 y 80 del siglo pasado muchos científicos pensaron en imitar la manera en que nuestro cerebro obtiene reconstrucciones tridimensionales a partir de las imágenes suministradas por cada ojo –indica De Maeztu–. Sin embargo, rápidamente se hicieron evidentes las diferencias entre nuestro cerebro y los ordenadores. Por esa razón, cada vez fueron cobrando más importancia soluciones adaptadas al funcionamiento de los ordenadores”.

Investigación novedosa

Junto a la propuesta de nuevas soluciones más simples que las existentes, De Maeztu ha trabajado de manera intensiva con ordenadores de reciente aparición en el mercado, que gracias a que incluyen nuevos tipos de procesadores permiten agilizar la ejecución de tareas complejas.

“Uno de los algoritmos propuestos –explica– obtiene unos resultados mejores que otros previos de su misma clase y, además, presenta una ventaja competitiva muy interesante: ser implementado en tiempo real en una tarjeta gráfica estándar. Aunque son algoritmos que requieren una gran capacidad de cálculo, si se utiliza toda la potencia de los actuales procesadores gráficos, se pueden llegar a ejecutar en tiempo real, es decir, a procesar tantas imágenes por segundo como las que captura la correspondiente cámara”.

Referencia bibliográfica:

L. De-Maeztu, A. Villanueva, and R. Cabeza (2012). Near real-time stereo matching using geodesic diffusion. IEEE Transactions on Pattern Analysis and Machine Intelligence 34(2): 410-416.

L. De-Maeztu, S. Mattoccia, A. Villanueva, and R. Cabeza. “Linear stereo matching” International Conference on Computer Vision (ICCV 2011) November 6-13, 2011, Barcelona, Spain.

Dejar respuesta

Please enter your comment!
Please enter your name here