martes, 25 de diciembre de 2018

ADQUISICIÓN DE UNA IMAGEN DIGITAL


Todos conocemos y usamos comúnmente las imágenes digitales en nuestra computadora, teléfono o cámara fotográfica, parecería muy obvio definir lo que es una imagen digital, sin embargo, científicamente una imagen digital es un tanto más complejo que una simple fotografía. Por definición, se podría decir que una imagen digital es una representación en 2D de una realidad análoga en 3D. 

El proceso de crear una imagen digital es muy similar a la forma en que nuestros ojos y cerebro perciben e interpretan nuestro entorno. En este artículo trataré de explicar este proceso de la forma más simple posible. Comenzaremos por ver a grandes rasgos las similitudes que tiene una cámara digital con el ojo humano. 

El ojo humano tiene una pequeña apertura lladada pupila, por donde pasan los rayos de luz hacia el cristalino, el cual dispersa los rayos de luz y los proyecta hacia la retina, coroides y demás sensores orgánicos, quienes captan la información y la mandan hacia el cerebro a través del nervio óptico. La información se procesa en el cerebro, quien a su vez corrige la orientación de la imagen, debido a que, al pasar los rayos de luz por el cristalino, cambia a dirección los rayos , poniendo la imagen de cabeza como muestra la ilustración de abajo en el inciso A. El cerebro después convierte la imagen en información útil como: noción del espacio, reconocimiento de objetos, distinción de tonalidades de color etc. 




Por su parte, una cámara digital (inciso B) tiene su obturador, quien cumpliría la función de la pupila, su lente convexo sería como el cristalino en el ojo humano, la matriz de foto celdas sería como la retina, coroides y demás, el nervio óptico serían los cables o uniones con soldadura hacia el procesador, quien sería como el cerebro. En el procesador se corrige la orientación de la imagen y se lleva a cabo un proceso llamado cuantización, donde se convierte la señal análoga captada por la matriz de foto celdas, en números con base en binario de acuerdo a una escala de niveles de intensidad pre-establecidos llamados niveles de cuantización. Estos niveles de cuantización son comúnmente de 0 a 255 (8 bits de profundidad), hablare sobre la cuantización en otro post.

La matriz de foto celdas capta las intensidades de luz en la forma de una combinación de 3 colores primarios: rojo, verde y azul referidos comúnmente como RGB por sus siglas en ingles. Recuerdas cuando eras niño o niña y mezclabas tus acuarelas para crear nuevos colores, pues esto es igual, pero con intensidades de luz. Los monitores de televisión, de hecho, tienen estos puntos de 3 colores a lo largo y ancho, si te acercas mucho a la pantalla, tal vez con una lupa, alcances a distinguir un montón de leds RGB diminutos. Cada punto RGB que conforma la imagen, se almacena digitalmente como un trio de números enteros, y se dice cada punto RGB es un elemento de la imagen o un pixel (acrónimo en ingles de picture element).


Esta mezcla de intensidades hace posible la representación de los colores de una escena real. Entonces una imagen digital podría decirse que es la composición de 3 matrices de intensidad de rojo, verde y azul. Si tomamos el fragmento marcado en la primera imagen de abajo, y hacemos coincidir cada pixel con cada punto RGB de un monitor (sin repetir pixeles debido al aumento de tamaño), se vería claramente la composicion de las 3 matrices (segunda imagen de abajo). En la imagen siguiente se muestran las matrices de color de los canales R, G y B por separado,  donde se puede ver la intensidad de cada punto, pero también se puede leer el valor numérico de intensidad tal como como lo haría la computadora.



Sabiendo que un pixel tiene 3 colores, y si la imagen se cuantiza a 8 bits (cada canal puede tener una intensidad de 0 a 255), las posibles combinaciones de color que se pueden representar en un solo pixel son 256^3 = 16,777,216 posibilidades.

A continuación pongo un enlace hacia unos programas donde demuestro lo que comento arriba.


¿Qué hay de las imágenes en escala de grises?.
Las imágenes en escala de grises podrian ser RGB o tener una sola matriz de color,  dependiendo del formato en que se graben. Si una imagen a escala de grises se graba en un formato especial, podria ocupar una sola matriz de color, pero al momento de mostrarlas en un monitor, se debe hacer una conversión a RGB. La ventaja es que ocupa menos espacio en memoria. Sin embargo si se graba com RGB, el resultado visualmente es el mismo, pero en este formato ocupa mas espacio en memoria.
Las imágenes grabadas en escala de grises no son tan comunes y se usan más bien para aplicaciones de visión por computadora.

Hay varios parámetros a considerar a la hora de elegir una cámara de visión, para que la imagen resulte nítida: el enfoque, el campo de visión o field of view (FOV por sus siglas en ingles) y la distancia focal (f) de la lente, el radio (r) de la lente, y el tamaño de la matriz de foto celdas (d), el índice de refracción del lente (n). 



La acción de enfocar según la real academia de la lengua española se refiere a hacer coincidir los rayos de luz reflejados a través de una lente en un plano focal (matriz de foto celdas) de modo que la imagen sea nítida. Las fórmulas que relacionan estos parámetros son las siguientes:
$$f = \dfrac{r}{2(n-1)}$$

$$FOV_{MAX} = 2 tan^{-1} \frac{d}{2f}$$


De estas fórmulas se puede deducir que, Cuanto mayor sea el radio de la lente mayor será el campo de visión, pero la distancia dentro de la cual se puede enfocar una imagen será menor. Por otro lado, el campo de visión máximo de una cámara se ve limitado por el tamaño de la matriz de foto celdas.Se debe encontrar un balance de estos parametros, entre otras cosas, para elegir la camara adecuada para la aplicación.

1 comentario:

  1. Merit Casino Review 2021 - xn--o80b910a26eepc81il5g.online
    Merit Casino Review 2021. Is 메리트카지노 it worth signing up? 1xbet korean Check our 메리트 카지노 쿠폰 2021 Merit Casino review to discover what is there to claim.

    ResponderBorrar