Loading

Module 1: Filtrado de imágenes y clasificación

Apuntes
Study Reminders
Support
Text Version

Clasificación de imagen supervisada

Set your study reminders

We will email you at these times to remind you to study.
  • Monday

    -

    7am

    +

    Tuesday

    -

    7am

    +

    Wednesday

    -

    7am

    +

    Thursday

    -

    7am

    +

    Friday

    -

    7am

    +

    Saturday

    -

    7am

    +

    Sunday

    -

    7am

    +

Vídeo 1

Hola a todos y bienvenidos a una nueva discusión y que vamos a tener en técnicas de clasificación de imágenes supervisadas. Y también vamos a discutir sobre las limitaciones de la clasificación supervisada o las técnicas de clasificación general también. Como sabemos que ya hemos discutido esta parte que hay 2 tipos de clasificación que hacemos en la teledetección o sobre las imágenes de detección remota. La primera es una clasificación no supervisada que ya hemos discutido y otra es la clasificación supervisada. Como también hemos discutido, pero muy brevemente mencionaré el propósito de la clasificación es crear un a partir de un continuo cambio de datos de imagen para crear un mapa y que es mejor interpretable y fácil de usar por los responsables de la toma de decisiones. Así que dos técnicas que uno es sin supervisión que significa totalmente basado en la computadora no mucha intervención humana están allí. Y la clasificación supervisada que en todos y cada uno de los pasos de las intervenciones humanas están ahí y especialmente para los conjuntos de entrenamiento que es lo más importante aquí. Y en base a los conjuntos de entrenamiento y luego las estadísticas correspondientes y luego la elección de la técnica de clasificación apropiada vamos para la clasificación y finalmente también vamos para la evaluación de la exactitud que voy a demostrar a usted en la próxima demostración que tendremos después de este debate sobre la clasificación supervisada. Una clasificación supervisada porque hay intervenciones humanas están ahí y por lo tanto se requiere un conocimiento previo de esa área y entonces solo se puede realizar la clasificación supervisada. Si la información previa sobre el área de la que pertenece la imagen del satélite si no está disponible, entonces se debe buscar una clasificación no supervisada en lugar de una clasificación supervisada. Sin embargo, si uno es muy bueno en las técnicas de interpretación de la imagen y tiene mucha experiencia en la interpretación de imágenes, entonces todavía se puede recurrir a la supervisión de la clasificación porque al seleccionar los conjuntos de entrenamiento y que son la base de la clasificación de supervisión. Si hay confianza en la selección de los conjuntos de entrenamiento en la clasificación de supervisión, entonces es posible que la clasificación supervisada se pueda lograr con una buena precisión. Así que donde usted sabe esto, uno tiene que recordar realmente que el conocimiento previo es muy requerido porque la experiencia es allí de la interpretación de la imagen entonces uno puede sentir que las diferentes clases que están presentes en la imagen o escena pueden tener un tipo convencional. Por ejemplo, las clases de cobertura convencionales para un ejemplo significa que podrían ser un bosque diferente tipo de bosque basado en la densidad. Podemos decir un bosque altamente denso o bosque abierto y entonces podríamos tener tierras agrícolas en esa escena y podríamos estar habiendo construido tierra, podríamos estar teniendo terrenos desnudos y ustedes saben lo que es el tipo de cosas. Así que todo esto se puede poner en las clases de cobertura convencionales. Si una imagen pertenece a un área montañosa, entonces uno tiene que ser muy cuidadoso. Si la imagen pertenece a la zona costera, entonces se requiere otra clase de cuidado diferente. Sin embargo, siempre es necesario subrayar aquí que se requiere el conocimiento previo. Si eso no está ahí y luego la experiencia si eso no está ahí entonces podría haber alguna otra fuente de información otro jugador de mapa también puede ser utilizado para entrenar el o crear los conjuntos de entrenamiento. Así que los sitios de entrenamiento o los conjuntos de entrenamiento se eligen para cada una de esas clases manualmente y esto se hace manualmente de grueso en una imagen digital que voy a mostrar a usted también. Y cada sitio de entrenamiento representa básicamente una clase y no es necesario que para cada clase sólo se recolecte un conjunto de entrenamiento que puede ser muchos conjuntos de entrenamiento para una clase puede ser recolectada. Por ejemplo, si estoy viendo y muchas áreas están teniendo bosques entonces en diferentes áreas voy a recoger conjuntos de entrenamiento y luego decir que si las características espectrales de estos conjuntos de entrenamiento son los mismos entonces clasificar como bosque. Así que cada uno de los sitios de entrenamiento o clase de resultados en una nube de puntos que vamos a ver a través de una figura en una dimensión n que es el espacio de medición a través de tres tramas de dispersión dimensional estas nubes también se puede mostrar. Y entonces esto representa la variabilidad de diferentes características espectrales de píxel o firmas en esa clase. Así que cualquiera que sea la variación dentro de esa clase que tomo tomé el ejemplo de bosque.
Así que, cualquiera que sea la variabilidad en la firma espectral de una clase de bosque, allí están agrupados como uno. Como por ejemplo aquí lo que estamos viendo es un pre-esto es un lado y una imagen está allí de pertenecer a una zona costera y diferentes conjuntos de entrenamiento han sido seleccionados aquí. Y si me enfoco en decir en áreas amarillas, entonces esto es lo que ustedes saben que una parte en el cuerpo de agua ha sido seleccionada y donde dice que su sedimento a sedimento que significa que podría ser algo suspendido o turbiedad podría estar allí. Pero si usted viene muy cerca de las áreas costeras que está encontrando más sedimentos están allí. Así que ellos son el lado se selecciona aquí es diferente que es el sedimento uno. Y luego también sabes que el agua del mar ha sido seleccionada donde no vemos ninguna firma o evidencia de sedimentos entonces es el agua de mar que ha sido seleccionada. Así mismo en toda la zona se han seleccionado estas cosas para una zona verde se han seleccionado dos sitios de entrenamiento que es una célula de cordura e inicialmente se pueden dar algunos nombres. Pero más adelante en estos nombres se puede cambiar es para el conjunto de entrenamiento. Y una más está ahí como aquí se han identificado claramente los árboles y que por lo que hay 2 conjuntos de entrenamiento casi para cada clase al menos hay 2 conjuntos de entrenamiento para cada clase están ahí. Siempre es una buena práctica y mientras se hace esta clasificación supervisada que al menos 2 o más conjuntos de entrenamiento para cada clase deben ser seleccionados dentro de esa imagen. De modo que obtengamos una mejor variabilidad de las características espectrales contra cada clase. Y uno dice y estos ha habido y eso significa que el equipo ha sido entrenado en estos. El siguiente paso es asignar cada clase a una clase espectral y que aparezcan o pertenezcan a partir de sus valores de pixel y dentro de que ahí lo sepas porque estaremos realizando en el tú conoces imágenes de color o compuesto de color falso así en bandas constituyentes. Y luego hay algoritmos de clustering que también se utilizan a los que se ven estas nubes de píxeles en un espacio n dimensional. Y luego la medición también se hace dependiendo de qué tipo de algoritmo utilice uno. Y los pixels que no están cayendo en ninguna de estas clases se clasifican como usted sabe sin clasificar o no dando ningún conjunto de entrenamiento allí. Por ejemplo aquí se han usado tres curvas dimensionales en este esquema y lo que está mostrando la banda 4 banda 5 y la banda 6. Y estos son los clústeres que se han utilizado aquí, por ejemplo, podrían ser clústeres para un área y otros clústeres pueden ser las ondas de área y otro clúster está aquí y así sucesivamente. Ahora cómo se va a asignar a qué clúster se va a hacer esto y que vamos a ver que los algoritmos basados en los diferentes algoritmos que se utilizan en el espacio de medición para solucionar que este clúster pertenece a una clase particular.

Vídeo 2

Por lo que el algoritmo que se utiliza son los mismos que es la distancia mínima a la clasificación principal y de modo que encontramos que usted sabe la agrupación en clúster cómo la agrupación está allí si es un clúster muy abierto entonces esta distancia mínima a la media va a ser grande. Pero si hay clusters ajustados entonces esta puede ser una de las opciones de entre los algoritmos. Otro algoritmo puede ser una clasificación de probabilidad máxima de Gauss que la probabilidad se basa en la probabilidad. Y luego la clasificación por tuberías de paralaje también está ahí y estaremos viendo pronto una cifra a través de la cual trataremos de entender todas estas 3 técnicas de clasificación bien conocidas que se utilizan en la clasificación de supervisión. Y cada uno si lo ponemos si usamos el mismo conjunto de entrenamiento de la misma imagen pero cuando clasificamos usando estos tres algoritmos diferentes es altamente probable que podríamos estar obteniendo 3 resultados diferentes pero y podría estar muy cerca de. Por ejemplo, el método más simple que es el primero que es la distancia mínima es decir es un en el que se traza el punto central teórico del clúster o nube de puntos. Y en función de los valores medios de ese clúster y punto no conocido se asigna a la más cercana de estos y a ese punto se le asigna la clase de cubierta. Así mismo y ahora estaremos viendo esto y eso en un espacio de 2 dimensiones en lugar de en 3 y sólo para entender y esto es de estimación gruesa. Pero se han utilizado los tres métodos que acabo de mencionar. Así que aquí está la primera parte superior izquierda A está mostrando los diferentes grupos de diferentes clases y clases se muestran aquí como los círculos son el maíz y esto para el heno y otras áreas urbanas y páramo.
Ahora cuando vamos por la primera técnica que es simple la distancia mínima para significar esto es la cantidad de distancia que se calcula un punto es la media general es más rápido aquí se calcula y luego se encuentra que el clúster a tener una distancia mínima de la media y luego la media de cada uno de estos clústeres son entonces sus clústeres se asignan diferentes clases y luego se va para la clasificación. Así que si miramos que la otra vez que la distancia mínima que el punto central teórico o punto de la nube es trazado. Así que esto es lo que el punto central teórico de la teoría de las nubes se representa aquí. Y basándose en los valores medios de estos clústeres, se asigna un punto no conocido a la más cercana de estos y el punto asignado a la clase de cubierta. Así es como la distancia mínima media distancia a la clasificación media o al trabajo del algoritmo. Cuando vamos por el segundo como simplificado o paralelepípedo que sabes en lugar de máxima verosimilitud el tercero lo tomaremos ese. Así que en un simple paralelepípedo lo que estamos encontrando y ese diferente tipo de y en lugar de decir y que son cajas o demarcación isdone en un espacio de dos dimensiones. Y luego cualquiera de los pixeles que se encuentran se están metiendo dentro de estas demarcaciones se asignan a una clase particular y este algoritmo se llama paralelepípedo simple. Hay un paralelepípedo impreciso que se puede ver que los grandes racimos están bien pero cuando nos centramos aquí encontramos que como para este ejemplo de clase hay aquí una gran superficie se ha tomado y por lo tanto también hay solapamientos. Así que para evitar esos solapamientos y uno como estos son los solapamientos que están viendo aquí y estos son los solapamientos y traerán errores en nuestra clasificación. Así que en una precisa se evitan estos solapamientos y en lugar de solo crear rectángulos o bien sabes cuadrado para cubrir cada clase se crean unas cajas muy precisas como esta aquí como puedes ver aquí y de igual manera. Así que esto dará una clasificación más precisa y es por eso que se llama la clasificación precisa mismo ejemplo aquí es también en esta parte que es sinónimo de aguas residuales o tal vez lo siento tal vez la clase de agua. Así también esto puede ser tan diferentes métodos de una clase espectral y puede ser representado aquí y en la trama de dispersión bivariada. Ahora la segunda opción que era una allí el segundo algoritmo que es la máxima probabilidad de que se basa en la probabilidad gruesa. Así que los contornos dicen que se dibujan y a medida que se va lejos del centro del clúster la probabilidad reduce de conseguir esos píxeles en esa clase particular del centro. Así pues, los contornos expresan básicamente la probabilidad de que cualquier punto que pertenezca a una clase particular, si lo tomo como ejemplo, entonces en clase, que es la base de la máxima verosimilitud método extraño de clasificación.
Así que los pixels que están teniendo estos valores están teniendo la mayor posibilidad de probabilidad de ser clasificados con mayor precisión y a medida que voy lejos del centro la probabilidad reduce. Así que podría haber algunos como en el área de la frontera y podría haber algún problema porque estos contornos de otra clase podrían estar también superpuestos allí. No es necesario que estos contornos tengan que ser circulares estos contornos pueden tener también forma eléctrica eléctrica. Y que decimos contornos equiprobabilística también así también se puede hacer la clasificación. Así que hay usted puede decir que hay general 4 técnica de clasificación por lo que son algoritmos que se utilizan en la clasificación supervisada uno es la distancia mínima para significar entonces usted conoce el estándar de esta clasificación paralelepipeped entonces la clasificación precisa paralelepípedo y la última es la máxima probabilidad que se basa en la basada en la probabilidad. Ahora como se mencionó anteriormente que es usted puede ver que los diferentes algoritmos están eligiendo diferentes clases en base a ciertos métodos. Algunos están usando la media que algunos están usando usted sabe que los límites para definir diferentes clases en algunos este como la máxima probabilidad se basa en la probabilidad. Y por lo tanto es inevitable que si pongo todos los algoritmos diferentes en la misma imagen con los mismos conjuntos de entrenamiento estoy obligado a tener resultados diferentes. Ahora puede haber una pregunta y esa que es la mejor y que sólo se puede decidir en base a una vez si estamos teniendo conocimiento previo o después de la clasificación a través de todas estas técnicas cuando vamos a tierra truthing. Y encontramos que un algoritmo en particular ha dado el mejor resultado entonces para ese área en particular se puede decir que esta técnica de clasificación o este algoritmo de clasificación se ha formado bien. Pero en la misma imagen si la temporada se cambia unas imágenes de fecha diferentes son diferentes fechas de la fecha del año allí puede obtener resultados diferentes. Por lo tanto, en un mínimo de imagen mínimo digamos mínima probabilidad máxima tal vez un más puede dar mejores resultados. Y en alguna otra fecha o estación de la misma área o tal vez del mismo sensor si uso de nuevo de la misma manera que puedo encontrar que la distancia mínima para significar MDM está dando mejores resultados. Así que esta es una base muy subjetiva y la clasificación lo mejor es encontrar la parte de precisión más tarde. La información previa o el conocimiento previo de esa área siempre ayudará y dará los mejores resultados en la clasificación. Ahora voy a mostrarles los ejemplos de 2 clasificación o el uso de 2 clasifica una es la primera opción que es la distancia mínima a la media que es allí que se puede ver aquí. Y otro es el método basado en la probabilidad en esta clasificación que es la clasificación de máxima verosimilitud. Y lo que encontramos es que el número de clases se ha mantenido igual pero si usted comienza a centrarse en áreas sabias o diferentes áreas que usted puede encontrar que algunos están recibiendo mejor clase mejor clasificados a través de una clasificación algunas clases y algunos se están mejor clasificados usando otra clase. Por ejemplo, aquí me parece que aquí en él se está obteniendo una mayor probabilidad máxima de que la máxima verosimilitud esté dando resultados más suaves. Y aunque los conjuntos de entrenamiento son los mismos que se han utilizado para estos 2 algoritmos de clasificación. Así que hay en la misma imagen los mismos conjuntos de entrenamiento 2 algoritmos diferentes 2 resultados diferentes. Este es el momento en el que uno vuelve a ser correcto, ya que he mencionado que hay que comprobar la exactitud de la evaluación, y entonces sólo se puede decir que se ha encontrado una clasificación particular para esa zona en particular, mejor o más adecuada. Así que esto dice como he estado mencionando que esta clasificación es muy subjetiva. En segundo lugar, hasta ahora no he tocado la resolución espacial. El conjunto de la resolución espacial y mejor los resultados que uno puede tener porque la diferencia en las características espectrales y dentro de los setspuede no ser tanto en comparación con las imágenes satelitales de alta resolución espacial. Así que más conoces la frontera en términos de su resolución espacial y la misma en términos de una resolución espectral también. Que si usted está teniendo un más amplio de curvas como en el Landsat MSS anterior o incluso Landsat TM usted puede conseguir que usted conoce resultados muy suaves en lugar de motas en su imagen en el mapa clasificado. Pero si usted va por imágenes de satélite de alta resolución y entonces la característica espectral para diferentes conjuntos de entrenamiento variará muy ampliamente y por lo tanto la salida puede no ser tan precisa que uno quisiera tenerlo. Así que eso significa lo que podemos decir en esta etapa que este algoritmo de clasificación también depende de una resolución espacial, así como de la resolución espectral o característica. Tan coarser estas cosas son los mejores resultados que uno puede obtener sin embargo, pero a esa escala podría ser bueno. Pero vamos por mayor resolución espacial alta resolución espectral nuestra expectativa a través de la clasificación es mucho más y por lo tanto tenemos que ser muy cuidadosos al elegir los conjuntos de entrenamiento en alta resolución espacial imagen satélite. Se requiere más atención con la alta resolución espacial en comparación con las imágenes de satélite de resolución relativamente gruesa. Así que esto es lo que mucha de la precisión de clase de la clasificación dependerá de muchas cosas sobre todo estoy hablando de clasificación supervisada y porque depende de la resolución espacial depende de la banda que usted ha elegido y entonces depende de su conjunto de entrenamiento de la forma exacta, la fiabilidad que ha recopilado estos conjuntos de entrenamiento. Y luego finalmente la evaluación de la parte de precisión de su exactitud de clasificación se puede evaluar a través de la técnica estadística y la exactitud debe ser evaluar si uno quisiera desarrollar un mapa de uso de la tierra de voz altamente confiable o el mapa de la cubierta forestal están fuera de esta técnica de clasificación o un mapa litoológico y luego la trucosa de tierra es muy necesaria. Y si un suelo en el suelo si se ha comprobado como una imagen se ha clasificado como un budgie denso o un bosque denso pero cuando vamos en el campo, encontramos que es bosque abierto no denso bosque. Entonces de nuevo y los conjuntos de entrenamiento tienen que ser cambiados y la clasificación tiene que volver a volver a hacerse para que coincida con la verdad del suelo. Así que hay mucha subjetividad no hay menos el propósito principal aquí es reducir el número que usted conoce el yo digo imagen continua y a través de estas técnicas de clasificación que estamos reduciendo en ciertas categorías y discretizando el conjunto de datos integrales en pocas clases. Así que esto pone fin a esta breve discusión sobre la supervisión de la clasificación muchas gracias.