Loading

Alison's New App is now available on iOS and Android! Download Now

Study Reminders
Support
Text Version

Set your study reminders

We will email you at these times to remind you to study.
  • Monday

    -

    7am

    +

    Tuesday

    -

    7am

    +

    Wednesday

    -

    7am

    +

    Thursday

    -

    7am

    +

    Friday

    -

    7am

    +

    Saturday

    -

    7am

    +

    Sunday

    -

    7am

    +

Última conferencia, hablamos sobre extractores de características y descriptores de características. En particular, hablamos de sift y su varianza. Antes de ir a otro tipo de características, vamos a tomar un ligero desvío y hablar de otra tarea importante en el procesamiento de imágenes, que es la segmentación de la imagen. La visión humana ha sido estudiada extensamente desde varias perspectivas. Y una de las perspectivas de la percepción humana se ha basado en lo que se conoce como el, apenas empezar el tiering, que surgió hace casi cien años, que tenía este principio fundamental de que el todo es mayor que la suma de sus partes. Y una de las piedras angulares importantes de esta teoría era la idea de agrupar para entender la misión humana. Por lo tanto, esta es una ilusión óptica muy popular. Es conocido como el mentiroso de Mueller, por lo general, que pide al espectador en cuanto a cuál de estas líneas horizontales es más largo. Y debido al sesgo de las percepciones humanas hacia ver las cosas como un grupo. Y no la competencia individual. La ilusión realmente surge aquí y hace que una luz se vea más larga que la otra mientras que las líneas horizontales son exactamente la misma tierra en ambas. Es sólo, sólo la teoría de inicio, propone varios factores en las imágenes que pueden resultar en la agrupación. Así que por un lado, podrías tener proximidad para ser una razón cuando hay objetos o artefactos en la imagen, que simplemente están cerca uno del otro. Y estos grupos se encuentran en diferentes partes de la imagen que podrían resultar en una especie de agrupación, o bien podría ser la similitud de los mismos objetos. Algunos objetos son círculos huecos, algunos objetos son círculos. Y sólo porque estos objetos son diferentes. Consiguen un buen grupo de manera diferente. Cuando percibimos esta dimensión, otros factores podrían ser el paralelismo. Hay grupos de líneas que tienen propiedades y dubs similares de paternalismo. Acabamos de agruparlos, u otra opción también podría ser simplemente simétrica. Sólo ver artefactos en el sentido simétrico nos hace agruparlos en una, una manera particular. Además, también podría tener similitud o para diferentes tipos. Usted podría tener un destino común en términos de estas flechas que le dicen a dónde van estos boondocks. Así que en el segundo ejemplo aquí, todos estos puntos, nuestro modelo está tendido en una línea recta, pero las flechas nos permiten agruparlos de manera diferente. Así que en un sentido de donde van a ir a lo largo de la dirección de las flechas, Da el sistema visual humano, una señal de cómo deben ser agrupados, o podría ser puramente debido a una región común que ya estaba marcada como un círculo. Podría ser debido a que continuamente tienen artefactos en buen video al cierre de artefactos. Como puedes ver, hay muchos factores que resultan en la percepción humana, viendo las cosas como grupos. Y apenas empezar a escuchar es bastante descriptivo. Establece diversas normas y principios diferentes que podrían conducir a la agrupación. Cuando los humanos perciben imágenes. Qué tal estas reglas por sí mismas claramente definidas lo suficiente como para convertirse en algoritmos. Así que realmente no puedes tomar la regla directamente e implementar el pseudo código para esa herramienta que podría ayudarte a encontrar, dicen los grupos en una imagen. Así que para el resto de esta conferencia, vamos a hablar de esa segmentación de la imagen del núcleo de la tarea, donde tratamos de agrupar píxeles similares en diferentes grupos. Puede llamar a esto parecido a la agrupación en clúster donde agrupa diferentes píxeles en sus propios clústeres, uh. Así que una parte significativa de esta conferencia es tomada de David grifos, este libro y la venta de libros de esquís. Y compartiríamos estas influencias al final. Uno de los métodos más antiguos para la segmentación de imágenes se conoce como segmentación de cuencas. Esto se desarrolló en 1979. Uh, una segmentación de imagen recordar es la tarea de agrupar píxeles en una imagen. Así que esa es la tarea que estás buscando. El método de segmentación de cuencas. Segmentos e imagen en lo que se conoce como regiones de base de captación. Va junto con el nombre. Por eso se llama segmentación de cuencas. Eso será, se curará lo suficiente en la siguiente diapositiva. Por lo tanto, puede ver cualquier imagen de escala de grises como una superficie topológica 3d. Así, por ejemplo, si usted tiene esta imagen de escala de grises, Muy similar a cómo hemos visto una imagen como una manera de volver a funcionar en una de las conferencias anteriores. Así que puedes ver una imagen como una superficie topológica 3d, donde los picos de la señorita blanca en estos, um, Beverly uh, ubicaciones y la blancura disminuye en otras ubicaciones. Y las áreas oscuras son donde tienes píxeles negros en la imagen original. Lo que el agua debe hacer la segmentación para hacer es segmentar la región segmentar la imagen en las regiones con una idea conceptual del flujo de agua de lluvia, fluyendo hacia el lago de la sal SIM. Así que vas a crear una metodología. Vamos a ampliar el grado de agua de inundación en su imagen y donde quiera que tenga cuencas de captación en la imagen. Imagine esta representación topográfica 3d de la imagen original. Dondequiera que tengas agua estancada, esos grupos de píxeles forman segmentos. Veamos esto en un poco más detalle. Así que identificas varios mínimos locales en tu imagen. Recuerde el mínimo local como simplemente valores. Dónde están las ubicaciones de píxeles donde su valor de intensidad de imagen es bajo. Recuerda de nuevo, que la intensidad de la imagen puede estar entre cero y dos 55. O cero y uno, si normalizas los valores en la imagen, así escoges tu, toma ciertos barrios decir, uh, qué pasa con un cinco por cinco lo que sea que sea y usando el proceso se encuentra mínimo local esa luz a través de la imagen. E inundan el paisaje de los mínimos locales y una fusión probada de agua de diferentes mínimos. Así que eso significa que usted comenzará con el mínimo local y lentamente se mantendrá en expansión, que es igual a la inundación aquí hasta que usted va a un punto que es accesible en el mismo número de píxeles de bajo el mínimo local. Así que ahí estaría el día de la bomba entre estas dos regiones. Así que esto resulta, los resultados del proceso simple. No hay nada muy elegante sobre esto aparte de lo que acabo de mencionar. Así que este proceso da como resultado el particionamiento, la imagen en cuencas, cuencas y líneas de cuencas. Recuerde que este método fue propuesto a finales de los años setenta y fue utilizado durante muchos años para segmentar imágenes en varias partes. Generalmente se aplica en gradientes de imagen en lugar de la imagen en sí. Sólo para darle un ejemplo visual. Así que la imagen original es ésta. Lo ideal sería agrupar los píxeles. Así que primero se toma una rejilla en partido. Ahora, ya sabes cómo tomar un degradado para que coincida sin un borde liberado en el, en la imagen original. Así que ahora las cuencas de su degradado argumento de imagen en la imagen inferior izquierda. Y finalmente definir y obtener su salida de segmentación y ponerla de nuevo en la imagen original y la última es un método simple, pero funciona de manera bastante eficaz. Sin embargo, sí tiene algunas limitaciones si hay mucho ruido y, por ejemplo, digamos que tienes una imagen muy texturizada, por lo que puedes imaginar un montón de ondulaciones en allí, uh, en el, en la textura de la imagen. Mucho de eso es el ruido en la demencia. Terminarías con algo así porque van a ser muchas capturas. Así que ahora tratar de inundar esas áreas te llevará a muchas líneas de cuencas que separan muchas regiones diferentes. Estoy pensando lo que se conoce como por encima de la segmentación. Así que teniendo esto en cuenta, lo que debería la segmentación se utiliza típicamente. Como parte de un sistema interactivo donde un usuario apunta o unos pocos centros diferentes en la imagen, y luego el algoritmo inunda desde esos centros como solo, no preocupándose por otros centros como ese podría estar en la imagen. Así que esta idea puede ayudar a superar la limitación de la segmentación. Si te gustaría saber más, puedes leer el capítulo 5.2 0.1 en Solinski su libro. Este es uno de los métodos más tempranos. Desde entonces, ha habido muchos métodos que la gente ha desarrollado y uno podría categorizar ampliamente los métodos en la división de la región de dos tipos y la fusión de la región en los métodos de división de la región. Como el nombre sugiere la idea es comenzar con la imagen. Y luego seguir dividiéndose en regiones más finas y más finas. Veremos un ejemplo de este método, un poco más tarde en esta conferencia, el otro tipo, que es un poco más popular son los que se conocen como métodos de gestión de la región, donde se comienza con el píxel como región y se siguen fusionando píxeles y regiones de formación similares. Y puedes seguir adelante todo el camino a la imagen completa. Así que aquí hay un ejemplo de. Uh, una imagen que se ha marcado a los grupos de pixels, los grupos de pixels son también a veces llamados super pixels. Y esto a veces se utiliza generalmente como un paso de preproceso para la segmentación de nivel superior de otros. Uno de los métodos populares para hacer la segmentación de la imagen fue la segmentación basada en gráficos, que se propuso en los primeros dos miles por. Eso está en Schwab cuando propusieron el algoritmo de segmentación basado en gráficos, que utilizó similitudes de diferencias entre regiones para averiguar qué regiones a marzo en una determinada iteración. Así que si consideras una imagen como una gráfica G con vértices V y que simplemente comes, por lo que tienes un conjunto de testigos y un conjunto de imágenes y los píxeles forman nuevo, ¿qué es esto inicialmente? I, it just, uh, define between, so we define a pixel to pixel the metric. Por ejemplo, esto podría basarse en los valores de intensidad de estos dos píxeles. También podría definir esto. Usted está usando mecanismos más sofisticados al tomar probablemente un barrio y tomar gradientes orientados y así sucesivamente y así sucesivamente. Pero, ¿qué pasa con B esa medida? Tiene un píxel para pixel la métrica de similitud, que se define como w de E, que es el peso de ese borde. Unirse a esos dos píxeles en los que estamos definiendo que es similitud, donde sólo se da tal vez cuando lo hacemos, cuando queremos. Y sí añadimos dos píxeles, por ejemplo, esto, esta similitud, la métrica podría ser las diferencias de intensidad entre el, cualquier vecino. Off, ambos pixels. Cuando dicen vecinos innatos, tomas los tres tres cruces de barrio y excluyendo el pixel central, tendrás ocho vecinos diferentes. Estás llamando a eso como a cualquier vecino. Así que usted toma dos píxeles diferentes, tome eso, cualquier vecino y encontrar que intendiferencias de densidad. Eso podría ser una forma de computar de. Una vez que se define w de E, el método define una cantidad o diferencia intolerante para cada región C inicialmente el miembro, la Regencia sería sólo un píxel, pero en futuras iteraciones, la región podría ser una colección de píxeles. La diferencia interna se define como la tasa de borde más grande en el árbol de extensión mínimo de regiones, lo que significa que si tiene un montón de píxeles diferentes, encontrará el árbol de expansión mínimo del grupo de píxeles que tiene. Ahora usted está cavando la tasa de borde más grande en el árbol de extensión mínima. Vas a definir la dieta como diferencia interna. Hasta cierto punto esa va a ser la tasa de borde más grande de esa región. Es sólo una forma simplificada de decir que ese es un punto que si vas a definir otra cantidad, si vas a definir es para la mínima diferencia interna, la mínima diferencia interna se da por si tuvieras dos regiones, C1 y C2. La diferencia interna mínima entre estas dos regiones se da por un mínimo de la diferencia interna de C1. Además, es una pena elegida manualmente. Así que, uh, voy a explicar eso en un momento. Y luego la segunda cantidad es la diferencia interna de C2 y Bueno sólo siendo, viendo el número de pixels que tienes en la región, tal vez normalizarte en base a eso o así sucesivamente y así sucesivamente, que tenemos una cantidad y tomas el mínimo de lo que es este punto. Tenemos una región, una para quien la definirías en la diferencia del dólar. Además de alguna región de penalti C2 que es la diferencia inteligente, y es una especie de desove mejor trato. Yo tomo el mínimo de estos estudiantes. Una vez que usted tiene esto para cualquiera también, sólo en las regiones, que son al menos un borde que conecta cualquiera de ellos. Lo que hace esto, definimos una cantidad llamada diff de C1, C2, que se da por el borde de peso mínimo, conectando estas dos regiones. Así que por ejemplo, consideras todo lo que es solo uno. Nosotros hacemos tal que queremos venir de Regency uno. Y nosotros también venimos de una agencia. Así que todas las edades entre esas dos regiones y se toma el peso mínimo de los bordes que conectan estas dos playas con esta cantidad se define. El método define un predicado D para dos regiones, C1 y C2. Si el diff C one y la secuela es mayor que la diferencia interna mínima entre C1 y C2, entonces usted dice que es verdad. De lo contrario, usted dice que es falso. Esta ilustración le ayudará a entender esto un poco mejor. Diff es la tasa de borde mínima entre los buenos agentes, pero la diferencia mínima intolerante de nosotros. Es una diferencia mínima inteligente dentro de cada uno de estos, entre C1 y C2, lo que sea el mínimo. Así que si la diferencia entre las dos regiones es mayor que la mínima diferencia interna, no se quiere hacer nada. Si es la otra manera, las regiones serían marchadas. Esto predicho resulta ser falso. Ya sabe, que el diff es igual o menor que la diferencia mínima provisional, lo que significa que C2 es tan cercano a C1 como los píxeles separados más alejados en C1. Así que también puedes, Mudge C1, Pensacola. Esa es la idea principal con esta métrica en particular. Así, uh, para resumir este algoritmo fusiona cualquier dos regiones. La diferencia es menor que la diferencia mínima en dólares de estas dos regiones. Ese es un ejemplo de cómo funciona esto usando el barrio de ocho pixeles. Así que se puede ver que los resultados son bastante buenos. Los diferentes jugadores se separan, razonablemente bien. Partes del cuerpo se separan razonablemente. Si usted tiene algo más que distinto este aspecto en el capítulo 5.2 0.4, en lugar de libro de esquís, el siguiente método que vamos a mirar es otro método popular o la agregación probabilística, que fue propuesto por Alport en 2007. Este método es de nuevo, un algoritmo de coincidencia de región, y es un enfoque probabilístico. Como dice el nombre, utilizo este tipo de valores de intensidad QS para los valores de nivel de grado. Así como algún contenido de textura de no, una regiones específicas en la imagen. Por lo tanto, inicialmente el método considera cada píxel como una región, y luego asigna una probabilidad de fusión B IJ. Así que por cada dos píxeles, yo y J hay un cerdo de verosimilitud, que es lo probable que son estos dos píxeles demasiado. Y cómo asignar esa bolsa en base a esa intención, intensidad y textura. Mucho de estos, no vas a entrar en cada uno de esos detalles. Le señalaré a usted la referencia. Si estás interesado en saber cómo se implementa exactamente, puedes mirar el papel para esos detalles, pero en líneas generales se basa en la intensidad. Ya sabes, cómo la intensidad de cálculo a estas alturas, no tienes la textura del ordenador. Hablamos de ello la última vez. Así que el cerdo se basa en similitudes de intensidad y textura. Los dos píxeles. Ahora, dado un gráfico en una iteración en particular, digamos que es una X menos una. La titulación entonces se baja se da por un conjunto de ¿qué es esto? V S menos uno y E como el mío era uno. Así que el golf de la siguiente iteración, GS, cuando se espera empujar algunas regiones es, es una cosa mordida. Puede considerar un subconjunto de nodos de semilla, C. A partir de V S menos uno. Y mucha nota o regiones, si están fuertemente acopladas a regiones en, ver, ver lo que estamos haciendo aquí es que considerarían esos píxeles. Así que eso significa que usted diría que si usted tomó un subconjunto de nodos en vs menos un Richard otras notas, ¿verdad? Idealmente consideraríamos otras notas, que están en V S. Minus uno menos C. Esos serían los otros píxeles en el S menos uno. Usted considera esos píxeles. Y para cualquiera de los píxeles que tenga V a S suma de VIG, Jacob que pertenece a C dividido por la suma J que pertenece a V S menos uno menos CPAG. Cuando hay un problema es mayor que el umbral, ya sabes, que hay ciertos píxeles. Eso es bastante probable a mucho como los píxeles en, en las semillas de la región. Así que esta proporción es grande. Y luego el umbral, que el documento recomienda para establecer 2.2, entonces se fusionan esas legiones. Y una vez que se fusionan esas regiones, se propagan esas asignaciones. Pero los niños de nivel final, que serían propiedad de cualquier región mirando, los llamaré. Y usted hace este proceso. Sí. Hay un ejemplo de cómo funciona la agregación probabilística en la práctica. Así que esta es una imagen tomada de Selinsky su libro. Así que puedes ver aquí que la imagen a es la grilla de píxeles de nivel de grado. Así que es una imagen de cinco por cinco. Así podrás ver todos los acoplamientos de píxel en imagen B. Así que un borde grueso significa un acoplamiento más fuerte, un borde delgado significa que podemos acoplar. Por lo tanto, puede ver que los píxeles que son blancos están fuertemente acoplados entre sí debido a la similitud de intensidad. No te vieron realizar un límite, por supuesto, sentado donde combinas bordes que están cerca uno del otro. Y sólo que tomarías un píxel en particular y comienzas eso, que sería C. Entonces tomarías todo el otro V menos uno, menos C uh, de todos los otros píxeles en V S menos uno, menos C. Y entonces tratarías de averiguar cuál de ellos tiene una mayor probabilidad de margen basado en la intensidad, similitud y similitud de textura de nuevo, y luego sigues repitiendo este proceso. Puedes ver que después de dos niveles, por supuesto, obtienes una estimación bastante buena de diferentes regiones en la imagen. Bueno, pasamos a otro método popular conocido como segmentación de cambio medio. Esta materia es un enfoque diferente y utiliza una técnica más de búsqueda basada en la estimación de densidad no paramétrica. Por lo tanto, la estimación de densidad no paramétrica es un estándar para la cremallera que las personas en el aprendizaje automático utilizan para estimar la densidad de cualquier conjunto dado de observaciones. Así que los vectores de características de cada píxel en la imagen del zoom son algunas muestras de alguna distribución de probabilidad desconocida. Y vamos a estimar la función de densidad de probabilidad fuera de la imagen y encontrarla más, en algún sentido, las fronteras serían como lo que escondemos para la segmentación de la cuenca. Aunque en ese caso, hicimos un mínimo. Ahora vamos a hablar de un máximo. Y luego la imagen finalmente se segmenta. Una vez que se identifican los pabellones en la imagen, la imagen se segmenta pixel Weiss considerando cada conjunto de píxeles, que suben para no parecer más como un segmento consistente. Puede describirlo para las próximas diapositivas. Así que consideremos una imagen de ejemplo como se puede ver aquí. Así que es una imagen mundial bastante real a la derecha. Se ve la presentación del partido. Así que hablamos de espacios de color en la semana uno. Así que uno de los espacios de color que se discute popularmente se conoce como la estrella de inicio que empezamos, o el espacio de color lub. Así que esto es simplemente para la simplicidad de la trama de sólo el estudio enfermo. Usted comienza las características de esta imagen sólo por la simplicidad de la trama. Así que en este espacio de características, idealmente queremos averiguar cuáles son los modos de la distribución general de las intensidades al final, empezando por el espacio estelar. Entonces, ¿cómo encontrar los modos de tal distribución? Sí. Uh, la llamada, tus estudios y aprendizaje automático. ¿Se recuerda que uno de los enfoques de carga popular para estimar la función de densidad de propiedad o modos? Sería a través de artillero. Esa es la estimación. Así que van a usar el mismo método aquí para poder estimar qué es el PDF y cuáles son los modos de la distribución de las intensidades en un espacio particular. Por qué hemos tomado el ejemplo como el espacio del usuario final, usted podría hacer tal más hallazgo en cualquier otro espacio para ese asunto, también, sólo por simplicidad, usted va a considerar un ejemplo de una dimensión. Así que recuerda, una vez más que esta es una señal de una dimensión. Que se puede extrapolar a la imagen como una señal de servicio. Así que la forma en que estimaríamos esta función es que lo convertimos. Oh, los datos supongamos que usted tiene observaciones dadas por estos impulsos. Así que puedes ver esas líneas verticales, Louisa, tus observaciones, ese argumento. Así que usted estimaría su función de densidad F que es lo que queremos estimar mediante la conversión de sus datos, sus observaciones. Con algún tipo de trampilla de bits, supongamos que tienes un arma en el pastel. Así que usted podría hacerlo como una función de caída donde la cobertura es el ingenio y usted tiene X menos X para ser, uh, su función, su función genética que usted está cayendo o tan Camboya sus observaciones con este content. Te damos una estimación. ¿Cuál es su función? De eso era de lo que venían sus observaciones. ¿Qué hacemos con esto? Así que para encontrar la media de modos, la segmentación por turnos utiliza un método de ascenso de gradiente con varios reinicios. Por qué no es porque queremos encontrar el máximo de todos los modos de esa distribución de probabilidad. Así que empezamos con algunos invitados, por qué no para un máximo local. Podría ser cualquier punto. Recuerde cuándo debe realizar. Ascenso de gradiente, que es un procedimiento iterativo. Así que empiezas con algún punto y luego cada, cada iteración añades unos tiempos constantes el degradado a la estimación anterior y actualizas tu estimación una y otra vez y otra vez. Así que tienes una conjetura, ¿por qué no? Que podría ser cualquier punto aleatorio caducado. Así que calculamos la densidad o el gradiente de la densidad de la estimación F de X. Simplemente hablamos de cómo si los efectos se calculan usando ese artillero. Uh, ¿cómo elegir ese contenido? Hablaremos de ello en un momento. Así que usted tiene el gradiente de la densidad de la estimación F de X, ¿por qué no? Y damos un paso de ascenso en esa dirección. Así que el degradado va a ser dado por algo así como esta suma excita menos X, G de esta cantidad, donde G no es más que K prime, todo el derivado de la torta de embudo, simples limitadores. Así que el gradiente de la función de densidad puede ser escrito de manera ligeramente diferente. Puedes volver a escribir el degradado, vamos a ver la luz anterior. Así que esta era la rejilla que sólo el tipo de emoción es X en el G de X menos normas excita cuadradas por la cabeza cuadrada. Cuando G es K prime menos K prime o el gradiente de color. Así que tenemos que demostrar que esto puede ser escrito de manera ligeramente diferente. Donde el gradiente puede ser en una estimación, G capital G de X menos excitable. La capital G de X menos excite es simplemente la misma pequeña D que vimos en la diapositiva anterior en MX MX es como una contribución ponderada de los valores X que usted está considerando en esta competencia en particular. Tan excitante en el G de X menos emocionante. Dividido por la suma de todas las G de X menos X. ¿Por qué es una forma correcta de escribir desde la diapositiva anterior? ¿Quieres dejarte a ti para los deberes? No es la cifra para encontrar esto, pero yo lo trabajo por pasos de paso y usted realmente obtendrá la respuesta. Por lo tanto, este vector X, que corresponde al gradiente, también se conoce como la media desplazada. Es la diferencia entre X, lo siento, si tú, uh, no te señalé a esto menos X, pero, uh, es el cambio principal es la diferencia entre X y la media ponderada del gradiente de los vecinos alrededor de X, X está muy satisfecho. Los ojos de Frito y X menos X son los valores en el rango de ese filtro. Y se mira la solución muy similar a cómo resolvemos la convolución antes. En este caso, solo estamos hablando de una desvolución por la sencillez. Así que el vector MFX es el cambio principal. La diferencia entre X y la media ponderada del gradiente de los vecinos. Y una vez que usted consigue su cambio principal, que es también su gradiente en este caso en particular, un tema fue escalado múltiple. A continuación, su próxima iteración en su descenso de gradiente, su ascenso de gradiente. Vas a decir por qué clave más uno es igual a Y K más M de YQ. También puedes conocerla en la misma. Simplemente tendríamos un Waikiki y un experto en cáncer porque ahí es donde estás colocando Waikiki en este momento. Y te quedarás solo con Emma Viking como la cantidad, que se convertirá en YK plus, que se convertirá en modelo YK plus. Y sigues haciendo este proceso yo creativamente y finalmente llegarías a la más de la distribución. Y luego se encontrarían todos los puntos vecinos, que por escalada llevarían a que este centro comercial formara un segmento, otros puntos, que al reclamar llegaría a otros modos. Lo que esos segmentos, claramente este método se basa en la selección de nosotros adecuado Cardenal ingenio además de la Qué con su jugo también es importante y el impacto, el postre final, y que se elige. Y particularmente en la descripción, el enfoque parecía estar basado en el color. Lo tomamos en el espacio de la U B. También puedes considerar otros tipos de características de otros tipos de espacios futuros para encontrar los moldes. Fantástico. Por favor, mire el capítulo 5.3 0.2 en algunos esquís. Un momento, que no es un método de coincidencia de región, pero un método de división de región se normaliza para la segmentación. Una vez más, se utilizó un método muy popular durante muchos años, un segundo, un método basado en gráficos, pero un enfoque diferente en este caso, un gráfico que representa píxeles en una imagen. Se divide sucesivamente en partes. No se trata de marchar esta vez. Se trata de dividir. ¿Cómo se divide? Marcar las tasas de descuento entre píxeles en función de la similitud, la clasificación de dos píxeles es muy similar. Tal vez tengan intensidades similares. Usted les da una alta tasa de borde. Y si dos píxeles están más separados en una similitud, usted les da bajo peso. Así que aquí hay un ejemplo de tal gráfico que está construido. Así que el objetivo de esta sería la multa, el corte principal. No estás dispuesto a trabajar todo el material. Si estás invertido, puedes ver las diferencias y aprender más sobre él. Pero estás tratando de encontrar la copa principal, que te va a dar dos regiones diferentes como se muestra aquí. Y esos bordes, al retirarte obtienes los dos segmentos correspondientes, que es tu objetivo final. El corte principal se define como que algunos de todos los pesos son cómodos. Así que consideras dos conjuntos a y B dos conjuntos de lo que es esto. Y para todos los que pertenecí a un y J perteneciente a B se suman esas tasas de borde, dondequiera que conseguiste para lo que tienes una opción de a y B tienes un valor mínimo de corte. Ese es el coche que vas a elegir para dividir el gráfico en dos segmentos. Tan claramente como se puede observar aquí, este método sólo divide dos segmentos a la vez. Así que si quieres más segmentos, tendremos que hacer esto más y más veces, o probablemente usar otras heurísticas. Si quería combinarlos más tarde en menos señales. Pero uno de los problemas con el uso del mini carro es que también puede resultar en soluciones anteriores. ¿Por qué jabón, se puede pensar en ello? ¿Por qué este problema de tarjeta principal comienza en las soluciones de homenaje? Okay. La respuesta es muy simple cuando consiste en decir sólo un píxel. Y B consiste en decir otra región de píxeles, este envío, tal vez el más estricto a un conjunto más pequeño y por lo tanto puede tener un valor más pequeño cuando usted suma todos ellos arriba, lo que significa cuando podría favorecer regiones donde sólo hay un píxel en un sitio, que puede no ser, que puede ser simplemente un atípico y puede realmente no formar una buena segmentación para la imagen. ¿Cómo superar este problema? Este problema es superado por un método o normalizado, lo que mejora el problema de la tarjeta principal. Y el normalizado se define por tarjeta de AB por asociación de AB más corte de AB por asociación de DV. Veremos lo que son. Asociación se define de nuevo, como suma de todos los pesos en a y B, donde asociación de AB se da por asociación de AA más asociación de AB es la suma de todos los pesos. Y ahora lo que has hecho haciendo esta asociación de AB y asociación de BB es dos. Asegúrese de que el denominador contiene el número de imágenes. Así que, uh, en cada una de estas, en cada una de estas regiones, por lo que si solo hubiera un píxel en una región, recuerdo que una de estas cantidades llegará a ser muy alta como contra otra región, que son muchos más píxeles. Cuando el denominador tire hacia abajo del menú. Esto asegura que no se obtengan soluciones reveladas como lo que vieron en mí, pero se obtienen soluciones más útiles en la práctica. Así que el intestino realizado pasa a ser un problema parlamentario completo, pero las soluciones aproximadas para resolver esto ligeramente más en la guerra. Uh, pero puedes mirar a la gente o normalizar emitir segmentaciones. Si estás interesado en cómo se implementa realmente el asunto. Que esta era la formulación oral que tenía como ejemplo de cómo funciona la taza normalizada. Así que esta es la imagen de entrada, y se pueden ver las diversas regiones diferentes obtener que se segmenta utilizando las tripas normalizadas o las iteraciones del metal. Okay. Y muchos otros métodos para la segmentación med, tales como simplemente usar k-significa agrupación que también han sido métodos basados en Marcos, sobre campos aleatorios y campos aleatorios condicionales. Y muchos más. Si usted quiere tener un entendimiento detallado, por favor lea el capítulo cinco de los esquís de plata que un motor cercas al final de esta conferencia también. Pero la pregunta que la gente pregunta ahora es. Realmente necesitamos todos estos métodos de segmentación. Así que piensa que todo el curso se basa en un aprendizaje profundo para la visión de la computadora. No hay métodos de aprendizaje profundo que puedan segmentar el ministerio. Usted realmente necesita todo esto. Es una pregunta válida para muchas tareas de hoy. Usted no necesita estos métodos. El propósito de cubrir estos temas es darle un contexto de visión de computadora en la configuración de planificación de 3d. Pero algunos de estos métodos también se han utilizado en la era de aprendizaje profundo. Para aquellos de ustedes que son un poco más conscientes de estas áreas, los métodos anteriores de aprendizaje profundo que se utilizaron para la detección de objetos, lo que significa que se les da una imagen, están tratando de encontrar un objeto y dibujar el recuadro delimitador en cuanto a dónde se encuentra la imagen, ese objeto. Esa es la tarea de la detección. Y podría haber múltiples instancias de objetos o múltiples objetos en una imagen para los métodos iniciales de aprendizaje profundo para la detección de objetos. Fue, uh, este tipo de métodos de segmentación que realmente se utiliza para generar lo que Vermont ha escrito propuestas, donde los objetos podrían, como, como dije, uno de los primeros de la CNN, que es una Regencia y, y lo que se utilizó para la detección de objetos utilizar el método de segmentación de la tarjeta principal conocido como CPMC restringido, los principales cortes paramétricos para generar propuestas escritas para las señales de soplado completa. Hablaremos de los que están en detalle cuando llegamos a esa sección de la escuela. Pero esa es la razón por la que, uh, la segmentación de la imagen es útil para que usted sepa en este momento, la segmentación también puede ir más allá de las imágenes en los videos.