Procesado cortical y uniformidad del espacio de colorHacia una métrica euclídea para las diferencias de color
- Francisco M. Martínez Verdú Director/a
Universitat de defensa: Universitat d'Alacant / Universidad de Alicante
Fecha de defensa: 13 de de maig de 2011
- Inmaculada Pascual Villalobos President/a
- Valentín Viqueira Pérez Secretari/ària
- Julio Lillo Jover Vocal
- Manuel Melgosa Latorre Vocal
- José María Artigas Martín Vocal
Tipus: Tesi
Resum
Los modelos de visión del color, entre otras cosas, son capaces de predecir los descriptores perceptuales de estímulos visuales bajo diferentes condiciones de visualización. Dentro de los modelos de visión se puede hacer una clasificación. Por una parte tendríamos los modelos de apariencia de color y, por otra parte, los modelos neurales. Ambas familias de modelos predicen descriptores perceptuales, pero la diferencia principal entre ellos es que los modelos neurales además de predecir los descriptores perceptuales, tratan de emular las etapas de procesado del sistema visual humano. Sin embargo, es bastante habitual que nos encontremos ante la necesidad de evaluar diferencias de color entre dos objetos. Inicialmente, se desarrollaron modelos separados para predecir datos de apariencia de color y datos de diferencia de color. Rápidamente se hizo patente que lo ideal era obtener un único modelo que pudiera reproducir ambos tipos de datos. Así que la siguiente tentativa fue implementar, en modelos que ya predijeran los valores perceptuales, algún algoritmo que pudiera permitir predecir a partir de ellos las diferencias de color. Uno de los ejemplos más recientes lo tenemos en el CIECAM02, que es el último modelo de apariencia del color adoptado por la CIE (Comisión Internacional de Iluminación y Color) y recientemente modificado por Luo y colaboradores para implementar, a partir del modelo existente, una fórmula de diferencia de color. Sin embargo, el CIECAM02 no es un modelo neural. Pese a ser una problemática muy vieja, la CIE sigue teniendo comités técnicos que intentan solventar todos estos inconvenientes. Así por ejemplo, dentro de la división 1, que es la encargada de los temas relacionados con la visión y el color, encontramos comités técnicos como el TC1-55 que trata de encontrar un espacio de color uniforme para la evaluación industrial de diferencias de color usando datos experimentales, hito que también es perseguido en el desarrollo de esta tesis, aunque abordando el problema desde otro punto de vista. O comités técnicos como el TC1-75 que todavía centra sus esfuerzos en desarrollar un modelo que prediga correctamente la apariencia de los colores. Es natural pensar que el siguiente hito a alcanzar sería tratar de obtener un modelo que no sólo prediga los descriptores perceptuales y las diferencias de color, sino además que pueda hacerlo emulando las distintas etapas de procesado que tienen lugar en el sistema visual humano. Las ventajas que tiene usar un modelo neural frente a uno que no lo es pueden ser múltiples. La primera y más obvia, es que si podemos emular con bastante precisión los resultados de apariencia de color y diferencias, cabe pensar que las suposiciones intermedias sobre la fisiología del sistema visual son correctas, con lo cual pueden ayudar a entender de una forma más profunda qué pasa en la etapa cortical del sistema visual humano, que es algo que todavía no está tan claro como lo que pasa en las primeras etapas del sistema visual. Y en segundo lugar, si tenemos un modelo neural flexible, también cabe pensar que será mucho más fácil adaptar el modelo a cualquier tipo de condición de visualización, e incluso a tipos de anomalías visuales. Por otra parte, aunque vamos a trabajar con modelos neurales, en este trabajo sólo vamos a centrarnos en el estudio de los colores relacionados, sin abordar aspectos, no menos importantes, aunque sí bastante más complejos, como lo pueden ser la contribución de la forma, resolución espacial, movimiento o profundidad de los objetos al color percibido. Dado que actualmente ya hay muchos modelos neurales, que predicen con mejor o peor acierto los descriptores perceptuales de estímulos visuales, no vamos a tratar de obtener un modelo neural desde cero, sino que en su lugar, usaremos uno de los existentes. En concreto, el modelo neural que vamos a usar de punto de partida es el modelo ATTD05, el cual es un modelo neural multietapa de visión del color, que obtiene buenas predicciones de colores relacionados, y además es capaz de predecir ciertos efectos de apariencia de color. Pese a ello es un modelo, que como todos los demás, no tendrá en cuenta aspectos, que pese a que en algunos casos pueden tener relación directa con el color percibido del objeto, serán considerados parámetros fijos y no entrarán a formar parte del estudio aquí presentado. Nos referimos a aspectos como la forma del objeto, el tamaño, la distancia, la profundidad o el movimiento. En la primera etapa del trabajo, estudiamos la posibilidad de obtener una buena fórmula de diferencias de color para el modelo ATTD05. Así pues, será imprescindible hacer, en primer lugar, una breve descripción de dicho modelo, aportando toda la información relevante para la implementación del mismo. Y antes de implementar cualquier fórmula de diferencia de color, será imprescindible hacer un estudio de la uniformidad del espacio perceptual ATTD05, ya que si se obtiene una buena uniformidad es coherente suponer que se podrá implementar con éxito una fórmula euclídea de diferencia de color. Si por el contrario, no se consiguiera una buena uniformidad, no implica necesariamente que no se pueda obtener buenas predicciones de las diferencias, sino que posiblemente será más difícil obtenerlas. El estudio de la uniformidad se podría llevar a cabo de muchas formas. Hemos elegido hacerlo usando un conjunto de muestras del atlas Munsell, que se asume que están uniformemente distribuidas en el espacio de color. Como se explicará en el momento oportuno más detalladamente, en un espacio uniforme dichas muestras deberían distribuirse formando anillos concéntricos y equiespaciados. Evaluar cuánto se desvía la representación de las muestras de anillos concéntricos será, por ejemplo, un parámetro de uniformidad fácil de calcular. Pero, para poder interpretar el valor de ese parámetro y saber cómo de bueno o malo es ese resultado, lo mejor sería compararlo con las desviaciones sufridas por las mismas muestras en otro espacio perceptual de referencia, como por ejemplo, los modelos CIELAB y CIECAM02. Cuando tengamos asegurada la existencia de cierta uniformidad en el espacio perceptual del modelo, intentaremos implementar una fórmula euclídea de diferencia de color, y lo haremos siguiendo la misma estrategia que otros autores en trabajos similares. La fórmula de diferencia de color se definirá como la distancia entre dos puntos del espacio perceptual, previamente ponderados con tres coeficientes de escalado, que en principio son parámetros libres. Para obtener el valor de dichos parámetros, haremos una minimización del factor de rendimiento (conocido en inglés como Performance Factor o PF/3) que es un parámetro estadístico que puede ser usado para medir la bondad del ajuste entre las predicciones del modelos y los valores determinados experimentalmente. Para ello, usaremos el mismo conjunto de datos que los que fueron usados por Luo y colaboradores para la implementación de la fórmula de diferencia de color en el CIECAM02. Esta base de datos está formada por dos subconjuntos: pequeñas diferencias de color (SCD) y grandes diferencias de color (LCD). Las pequeñas diferencias de color (SCD) fueron recopiladas y usadas previamente por Luo y colaboradores para desarrollar la fórmula de diferencia de color CIEDE2000. Por otra parte, las grandes diferencias de color (LCD), fueron recogidas por varios autores: Zhu et al., OSA Guan and Luo, BFDB, Pointer and Attridge y Munsell. Por último evaluaremos si las diferencias de color que la fórmula predice son buenas o no. Dado que tenemos el conjunto de datos, previamente mencionado, que cuenta con las diferencias de color evaluadas experimentalmente, deberíamos usar algún test estadístico que determine si las predicciones de la fórmula sobre el modelo ATTD05 que se ha implementado se ajustan con mayor o menor precisión a los datos experimentales que otras fórmulas que son usadas en la actualidad, como puede ser la fórmula CIEDE2000 o la CIECAM02-USC. El test estadístico lo realizaremos en base al STRESS (siglas de STandardized Residual Sum of Squares), que es un parámetro que ya ha sido usado por otros autores para comparar diferentes modelos . Como veremos a lo largo de la tesis, tras un estudio estadístico de las predicciones de la fórmula sobre el ATTD05, éstas resultaron ser bastante mejores que los obtenidos por los modelos que son usados en la actualidad, como el CIELAB o CIEDE2000, sin embargo no demuestran ser significativamente mejores que los que se obtienen con el CIECAM02. Por ello, el siguiente objetivo de este trabajo será obtener otro modelo fisiológico u otra fórmula con las que poder mejorar los resultados. Intentar hacer cambios en la fórmula, proponiendo nuevas ecuaciones más complejas, podría llegar a mejorar considerablemente los resultados, pudiendo mejorar los obtenidos con el CIECAM02. Sin embargo, a nuestro entender, es una solución que no aporta ninguna contribución innovadora, ya que no tendría analogía alguna con el sistema visual humano. Veremos que pese a que el modelo neural que hemos elegido como punto de partida, el ATTD05, predice con bastante acierto los valores perceptuales de estudio, así como las predicciones de las diferencias de color obtenidas con la fórmula desarrollada en este estudio, presenta ciertas anomalías en su estructura. Así pues, en nuestra siguiente tentativa incorporaremos ciertos cambios a la estructura del ATTD05 con el fin de mejorar las analogías del modelo con el sistema visual humano y así mejorar indirectamente los resultados obtenidos con dicho modelo. El modelo resultante tras las modificaciones propuestas será al que nos referimos como ATTD10. Uno de los cambios más importantes que se van a proponer es la desaparición del canal del Magno. Por otra parte, se reconstruirán 4 tipos de células ganglionares diferentes, en lugar de dos, en la etapa del LGN, que permitirán la reconstrucción del canal acromático del Parvo. Veremos que la nueva estructura permitirá predecir las direcciones cardinales, que con el modelo original, el ATTD05, no podían ser obtenidas. Y finalmente, también cabe destacar, como una de las aportaciones más importantes que hacemos al modelo, la incorporación de mecanismos de adaptación divisivos, expansivos y sustractivos más consistentes con las células existentes en el córtex. A partir de este punto, tendremos que repetir sobre la nueva versión del modelo, el ATTD10, tanto el estudio de uniformidad que anteriormente hemos realizado sobre el modelo ATTD05, como el desarrollo de la fórmula de color, y comprobar si ha mejorado no sólo con respecto al modelo ATTD05, sino con respecto a los modelos que actualmente están recomendados por la CIE. A este respecto cabe destacar que, como veremos, los resultados finales no mejoran significativamente los resultados obtenidos con la versión original del modelo, sin embargo las cambios incorporados hacen mejorar la estructura del modelo desde un punto de vista fisiológico, es decir, que veremos que, aunque finalmente no obtendremos las mejoras deseadas en la uniformidad, sí hemos mejorado las analogías del modelo con el sistema visual humano. En un futuro, otras incorporaciones a la estructura del modelo ATTD10 o, incluso, la publicación de otros trabajos de los cuales se puedan extraer más datos neurofisiológicos y psicofísicos para el entrenamiento del modelo, podrían llevar a la mejora definitiva que esperábamos encontrar a lo largo de este estudio.