Buenas, algunos me habéis preguntado, varias veces, de qué va mi investigación. Así que he decidido explicarlo sencilla y brevemente.
En el marco del proyecto DRIVSCO, se está desarrollando un sistema de visión para ponérselo a un coche y que ayude al conductor en situaciones de baja visibilidad. Para ello, detectará obstáculos, situaciones peligrosas, etc y enviará una señal al conductor. Por lo tanto, será necesario captar las imágenes de 2 cámaras que llevará el coche y procesarlas para extraer distintas cosas (distancia de los objetos, velocidad y dirección de las cosas en movimiento, calzada y fallos estructurales en la misma, ...), que se conocen generalmente como primitivas.
Os daréis cuenta la de cosas que se consiguen con sólo 2 imágenes iniciales. El principal problema radica en almacenar y retransmitir tooooodo eso. Para eso estoy yo :D. Mi investigación va de condensar la información teniendo en cuenta la estructura de los objetos y para qué va a ser utilizada (no es lo mismo transmitir una imagen para buscar objetos en movimiento que para detectar agujeros en el suelo). Así que lo que yo hago es lo siguiente:
De esta forma, si cogemos la disparidad (que indica lo lejos que están las cosas) y la condensamos, sólo necesitaríamos enviar el 7% de los datos, pudiendo reconstruirla luego con un MSE de algo más de 1 como se ve en la imagen siguiente:
Y ya está, siento el rollo :P
En el marco del proyecto DRIVSCO, se está desarrollando un sistema de visión para ponérselo a un coche y que ayude al conductor en situaciones de baja visibilidad. Para ello, detectará obstáculos, situaciones peligrosas, etc y enviará una señal al conductor. Por lo tanto, será necesario captar las imágenes de 2 cámaras que llevará el coche y procesarlas para extraer distintas cosas (distancia de los objetos, velocidad y dirección de las cosas en movimiento, calzada y fallos estructurales en la misma, ...), que se conocen generalmente como primitivas.
Os daréis cuenta la de cosas que se consiguen con sólo 2 imágenes iniciales. El principal problema radica en almacenar y retransmitir tooooodo eso. Para eso estoy yo :D. Mi investigación va de condensar la información teniendo en cuenta la estructura de los objetos y para qué va a ser utilizada (no es lo mismo transmitir una imagen para buscar objetos en movimiento que para detectar agujeros en el suelo). Así que lo que yo hago es lo siguiente:
De esta forma, si cogemos la disparidad (que indica lo lejos que están las cosas) y la condensamos, sólo necesitaríamos enviar el 7% de los datos, pudiendo reconstruirla luego con un MSE de algo más de 1 como se ve en la imagen siguiente:
Y ya está, siento el rollo :P