¿Qué es Análisis de imagen?

La tecnología de analizar, describir, clasificar y explicar la escena mediante el uso de métodos de reconocimiento de patrones e inteligencia artificial, también conocida como análisis de escena o comprensión de imágenes.

Desde la década de 1960, ha habido muchos resultados de investigación en el análisis de imágenes, y la tecnología de análisis de imágenes para problemas y aplicaciones específicos se ha desarrollado gradualmente en la dirección de establecer teorías generales. El análisis de imágenes está estrechamente relacionado con el contenido de la investigación, como el procesamiento de imágenes y los gráficos por computadora, y se superpone entre sí.

Pero el procesamiento de imágenes estudia principalmente la transmisión, el almacenamiento, la mejora y la restauración de imágenes; los gráficos por computadora estudian principalmente los métodos de representación de puntos, líneas, áreas y cuerpos y el método de visualización de información visual; el análisis de imágenes se centra en el método de descripción para construir imágenes, es más para usar símbolos para representar varias imágenes, en lugar de realizar operaciones en la imagen en sí y usar varios conocimientos relevantes para razonar.

Anuncios

El análisis de imágenes también está estrechamente relacionado con la investigación sobre la visión humana La investigación sobre ciertos módulos identificables en el mecanismo de la visión humana puede promover la mejora de las capacidades de visión por computadora (ver visión artificial).

Proceso de análisis

La siguiente figura muestra un modelo de un proceso de análisis de imágenes jerárquico. Básicamente, hay cuatro procesos en el análisis de imágenes. Entrada de sensor: convierte la escena real en una expresión adecuada para el procesamiento por computadora.

Para la escena tridimensional, también se convierte en una imagen plana bidimensional para su procesamiento y análisis (ver representación de la imagen). Segmentación: descomponga el objeto y sus componentes de la imagen de la escena (ver segmentación de la imagen). Los componentes están formados por primitivas de imagen. Descomponer la escena en una estructura tan jerárquica requiere la aplicación de conocimientos sobre los objetos en la escena.

Generalmente, la segmentación se puede considerar como un proceso de toma de decisiones y sus algoritmos se pueden dividir en dos tipos: tecnología de píxeles y tecnología regional. La tecnología de puntos de imagen consiste en clasificar cada punto de imagen mediante un método de umbral, por ejemplo, para encontrar los trazos en la imagen de texto comparando el nivel de gris del punto de imagen y el valor de umbral.

La tecnología regional utiliza características como la textura y el contraste de escala de grises local para detectar límites, líneas, regiones, etc., y utiliza técnicas de crecimiento, fusión y descomposición regionales para encontrar los componentes de la imagen.

Además, con el fin de investigar más a fondo el papel de la imagen en su conjunto en la segmentación, también se estudian métodos como las técnicas de relajación. Reconocimiento: asigne los nombres correspondientes a los objetos segmentados de la imagen, como carreteras, puentes, edificios en escenarios naturales o varias piezas de máquinas en líneas de montaje industriales automáticas.

Generalmente, se puede clasificar de acuerdo con la forma y la información de gris utilizando la teoría de la toma de decisiones y métodos estructurales, también puede construir una serie de modelos de imágenes de objetos conocidos, y emparejar y comparar los objetos a reconocer con cada modelo de imagen.

Explicación: Utilice métodos heurísticos o tecnología de interacción persona-computadora combinada con métodos de reconocimiento para establecer la estructura jerárquica de la escena y explicar qué objetos hay en la escena y cuáles son las relaciones entre los objetos. En el caso de una escena de objeto tridimensional, se puede utilizar diversa información conocida de la escena de objeto y el conocimiento de la relación de restricción mutua entre varios objetos en la escena de objeto.

Por ejemplo, infiera la tendencia de la superficie de la escena del objeto tridimensional a partir de las sombras en escala de grises, los cambios de textura y las formas del contorno de la superficie en la imagen bidimensional; también puede basarse en datos de rango o en varias imágenes bidimensionales. desde diferentes ángulos para la profundidad de campo Calcule la descripción y explicación de la escena tridimensional.

Aplicación Latecnología de análisis de imágenes específica del objetivo se ha aplicado en la industria, la inspección, la teledetección, la informática, el ejército y otras tecnologías. Automatización industrial: tales como robots que agarran objetos, manipulación automática de máquinas de unión de cables y herramientas de corte, procesos relacionados con la fabricación de circuitos VLSI como unión de cables, alineación y empaque de chips, y grandes cantidades de datos de sitios de pozos de petróleo o datos sísmicos.

Monitoreo y revisión, proporcionando retroalimentación visual para montaje y reparación automáticos. Inspección: inspección de esquinas afiladas, cortocircuitos y conexiones deficientes en placas de circuitos impresos, inspección de impurezas y grietas en las piezas fundidas, detección de imágenes médicas e imágenes tomográficas y detección rutinaria de productos de fábrica.

Detección remota: cartografía, monitoreo de tráfico, gestión de recursos, exploración de minerales. Aplicaciones informáticas: existen gestión de sistemas de información, lectores de documentos, diseño asistido por ordenador para construcción e ingeniería mecánica. Aspectos militares: seguimiento de objetos en movimiento, navegación automática, búsqueda y rango de objetivos, etc.

Tendencias en el desarrolloAunque se han logrado muchos resultados en la investigación del análisis de imágenes y aplicaciones prácticas en muchos campos, todavía existen muchos problemas para establecer una base teórica común, que deben resolverse más.

Por ejemplo, la representación precisa de la imagen, la información de la superficie a diferentes niveles de resolución, el establecimiento de una estructura jerárquica de la representación, el uso y determinación del color de la superficie y la información de estado, el proceso de percepción del estado de movimiento y la Método de obtención de información del flujo óptico. Métodos de aplicación de información específica en la percepción visual, etc.

Mira estos Artículos

Subir