Loading

Alison's New App is now available on iOS and Android! Download Now

Study Reminders
Support
Text Version

Set your study reminders

We will email you at these times to remind you to study.
  • Monday

    -

    7am

    +

    Tuesday

    -

    7am

    +

    Wednesday

    -

    7am

    +

    Thursday

    -

    7am

    +

    Friday

    -

    7am

    +

    Saturday

    -

    7am

    +

    Sunday

    -

    7am

    +

Ultima lezione, abbiamo parlato di estrattori di funzione e descrittori di funzionalità. In particolare, abbiamo parlato di sift e della sua varianza. Prima di passare ad altri tipi di caratteristiche, faremo una leggera deviazione e parleremo di un altro importante compito nella lavorazione delle immagini, che è la segmentazione delle immagini. La visione umana è stata studiata esteticamente da diverse prospettive. E una delle prospettive della percezione umana si è basata su quello che è noto come il, giusto start tiering, emerso quasi cento anni fa, che aveva questo principio fondamentale che il tutto è maggiore della somma delle sue parti. E una delle pietre miliari importanti di questa teoria era l'idea di raggruppare per comprendere la missione umana. Ecco, questa è un'illusione ottica molto popolare. Si sa come se Mueller bugiardo, di solito, che chiede di visualizzatore su quale di queste linee orizzontali sia più lunga. E a causa delle percezioni umane bias verso la visualizzazione delle cose come un gruppo. E non la competenza individuale. L'illusione in realtà sorge qui e fa sembrare una luce più lunga dell'altra mentre le linee orizzontali sono esattamente la stessa terra in entrambi. È solo, solo start teoria, propone vari fattori in immagini che possono causare il raggruppamento. Quindi da una parte si potrebbe avere la prossimità per essere un motivo quando ci sono oggetti o manufatti nell'immagine, che sono semplicemente vicini l'uno all'altro. E questi gruppi mentono in diverse parti dell'immagine che potrebbero tradursi in una specie di raggruppamento, oppure potrebbe essere solo la somiglianza degli oggetti stessi. Alcuni oggetti sono cerchi cavi, alcuni oggetti sono cerchi. E solo perché questi oggetti sono diversi. Prendono un buon gruppo in modo diverso. Quando percepiamo questa dimensione, altri fattori potrebbero essere il parallelismo. Ci sono gruppi di linee che hanno proprietà simili e dubi di paternalismo. Finiamo per raggrupparli, o un'altra opzione potrebbe anche essere solo simmetrica. Vedere solo manufatti in senso simmetrico ci fa raggrindire in uno, un modo particolare. Inoltre, si potrebbe avere anche somiglianza o per diversi tipi. Potresti avere un destino comune in termini di queste frecce che ti dicono dove stanno andando questi boondocchi. Così nel secondo esempio qui, tutti questi doti, il nostro modello si posa in linea retta, ma le frecce ci fanno raggruppare in modo diverso. Così in un certo senso di dove vanno lungo la direzione delle frecce, Gives il sistema visivo umano, un manto a come dovrebbero essere raggruppati, oppure potrebbe essere puramente a causa di una regione comune già segnata come un cerchio. Potrebbe essere dovuto continuamente avere artefatti in buoni video alla chiusura di manufatti. Come potete vedere, ci sono molti fattori che determinano la percezione umana, visualizzando le cose come gruppi. E basta iniziare a sentire che è abbastanza descrittivo. Esso stabilisce diverse regole e principi che potrebbero portare al raggruppamento. Quando gli umani percepiscono le immagini. Che ne dite di queste regole da sole chiaramente definite abbastanza da diventare algoritmi. Quindi non si può davvero prendere la regola direttamente e implementare il codice pseudo per quello strumento che potrebbe aiutare a trovare, dire gruppi in un'immagine. Così per il resto di questa lezione, parleremo di quella segmentazione delle immagini core, dove cerchiamo di raggruppare pixel simili in gruppi diversi. Si potrebbe chiamare questo tipo di clustering dove si raggruppano pixel diversi nei propri, uh, cluster. Così una parte significativa di questa lezione viene presa da David Faucets, questo libro e vende libri di sci. E condivideremmo queste influenze alla fine. Uno dei metodi più antichi per la segmentazione delle immagini è noto come segmentazione impermeabile. Questo è stato sviluppato nel 1979. Uh, una segmentazione dell'immagine ricorda è l'attività di raggruppamento dei pixel in un'immagine. Quindi questo è il compito che state cercando. Il metodo di segmentazione impermeabile. Segmenti e immagine in quelle che sono note come regioni di bacino. Va insieme con il nome. Ecco perché si chiama segmentazione impermeabile. Questo sarà, diventare abbastanza cupo nella prossima slide. Così è possibile visualizzare qualsiasi immagine in scala di grigio come una superficie topologica 3d. Così ad esempio, se si ha questa immagine in scala grigia, Molto simile a come abbiamo visto un'immagine come una funzione di ritorno in una delle lezioni precedenti. Così si può visualizzare un'immagine come una superficie topologica 3d, dove la miss bianca si pesa a queste, um, Beverly uh, locations e la whitezza si sovvenzionano in altre località. E le zone scure sono dove si hanno pixel neri nell'immagine originale. Ciò che l'acqua dovrebbe segmentare il luogo a fare è quella di segmento segmento regione l'immagine in regioni con un'idea di concetto di scorrere dell'acqua piovana, scorrere nel lago di sale SIM. Così si creerà una metodologia. Stiamo per zoomare il grado di acqua di alluvione nella tua immagine e ovunque tu abbia dei bacini di utenza nell'immagine. Immaginate questa rappresentazione topografica 3d dell'immagine originale. Ovunque si abbia stagionatura dell'acqua, quei gruppi di pixel formano segmenti. Vediamo questo in un po' più di dettaglio. Così si identificano vari minimi locali nella propria immagine. Ricordare i minimi locali come semplici valori. Dove sono le posizioni di pixel dove il tuo valore di intensità dell'immagine è basso. Ricordati ancora, che l'intensità dell'immagine può mentire tra zero e due 55. Oppure zero e uno, se si normalizzano i valori nell'immagine, quindi scegli il tuo, prendi certi quartieri dicono, uh, che ne dici di un cinque - per - cinque qualunque cosa possa essere e usando il processo scopri il minimo locale che si illude in tutta l'immagine. E si inondano il paesaggio dai minimi locali e si sta provando una fusione comprovata di acqua da diversi minimali. Quindi il che significa che si comincerebbe con il minimo locale e si continua a continuare ad espanderne, che è uguale all'inondazione qui fino a quando non si va ad un punto raggiungibile nello stesso numero di pixel da sotto il minimo locale. Ecco allora che il giorno della bomba tra queste due regioni mentirebbe. Quindi questi risultati, i semplici risultati di processo. Non c'è niente di molto elegante in questo diverso da quello che ho appena accennato. Così questo processo determina il partizionamento, l'immagine in bacino, bacini e linee d'acqua. Ricordate che questo metodo è stato proposto nel tardo settecento ed è stato utilizzato per molti anni per segare immagini in varie parti. Generalmente veniva applicato su gradienti di immagine piuttosto che l'immagine stessa. Giusto per darti un esempio visivo. Quindi l'immagine originale è questa. Idealmente vogliamo raggruppare i pixel. Così si prende per la prima volta una griglia in corrispondenza. Ora, sai come prendere una sfumatura per abbinarsi senza un bordo liberato sul, sull'immagine originale. Così ora le filiere del tuo gradiente argomento immagine nella tua immagine di sinistra. E finalmente si definisce e si ottiene la tua uscita di segmentazione e la rimetti sull'immagine originale e l'ultima è un metodo semplice, ma funziona piuttosto in modo efficace. Tuttavia, ha dei limiti se c'è molto rumore e, per esempio, diciamo che hai un'immagine fortemente testata, quindi puoi immaginare un sacco di ondulazioni lì dentro, uh, nella, nella consistenza dell'immagine. Un sacco di questo è rumore in demenza. Si finirebbe con una cosa del genere perché saranno tanti catchioni. Quindi ora cercare di inondare quelle aree vi condurrà a molte linee d'acqua che separano molte regioni diverse. Sto pensando a quello che è noto come la segmentazione. Tenete così a mente questo, quello che dovrei segmentare è tipicamente usato. Come parte di un sistema interattivo dove un utente punta o pochi centri diversi nell'immagine, e poi l'algoritmo alluvione da quei centri come da soli, non preoccuparsi di altri centri come quello potrebbe essere nell'immagine. Quindi questa idea può aiutare a superare la limitazione della segmentazione. Se ti piacerebbe saperne di più, puoi leggere il capitolo 5,2 0,1 a Solinski il suo libro. Questo è uno dei primi metodi. Da allora, ci sono stati molti metodi che le persone hanno sviluppato e uno potrebbe ampiamente categorizzare i metodi in due tipi di taglio regione e regione che si fonde in regione a splitting metodi. Come suggerisce il nome l'idea è quella di iniziare con l'immagine. E poi continuare a dividere in regioni finge e finge. Vedremo un esempio di questo metodo, un po' più tardi in questa lezione, l'altro tipo, che è un po' più popolare sono quelli che sono noti come metodi di gestione della regione, dove si inizia con il pixel come regione e continuano a unire pixel simili e formare regioni. E si può continuare ad andare avanti fino all'immagine completa. Ecco allora un esempio di. Ah, un'immagine che è stata segnata ai gruppi di pixel, gruppi di pixel sono anche a volte chiamati super pixel. E questo a volte viene generalmente utilizzato come passo di preelaborazione per una segmentazione di livello superiore degli altri. Uno dei metodi popolari per fare segmentazione delle immagini è stata la segmentazione basata su grafi, che è stata proposta nei primi due migliaia da. Questo a Schwab quando hanno proposto l'algoritmo di segmentazione a base di grafico, che ha usato le somiglianze di dissimilarità tra le regioni per scoprire quali regioni a marzo in una determinata iterazione. Quindi se si considera un'immagine come un grafico G con vertici V e si mangia appena, quindi si ha una serie di testimoni e un insieme di immagini e i pixel formano nuovi, che cosa è questo inizialmente? Io, semplicemente, uh, definire tra, così definiamo un pixel per pixel la metrica. Ad esempio, questo potrebbe essere basato sui valori di intensità in questi due pixel. Si potrebbe anche definire questo. Stai usando meccanismi più sofisticati probabilmente prendendo un quartiere e prendendo sfumature orientate e così via. Ma che ne è di B che misura? Hai un pixel per pixel la metrica di similitudine, che è definita w di E, ovvero il peso di quel bordo. Unire quei due pixel su cui stiamo definendo che è somiglianza, dove si dà solo magari quando facciamo, quando vogliamo. E aggiungiamo due pixel, ad esempio questo, questa similitudine, la metrica potrebbe essere le differenze di intensità tra i, eventuali vicini di casa. Off, entrambi questi pixel. Quando dicono i vicini di innata, prendete i tre vicini di quartiere e escludiamo il pixel centrale, avrete otto vicini diversi. Lo chiami come qualsiasi vicini di casa. Quindi prendi due pixel diversi, prendi quello, qualsiasi vicino e scopri che intendifferenze di sità. Potrebbe essere un modo di calcolo w di. Una volta w di E viene definito, il metodo definisce una quantità o una differenza intollerante per ogni regione C inizialmente il membro, la Reggia sarebbe solo un pixel, ma nelle iterazioni future la regione potrebbe essere una raccolta di pixel. La differenza interna è definita come la più grande velocità di bordo nelle regioni minima albero di abbronzatura, il che significa che se avete un branco di pixel diversi, trovate l'albero di spanning minimale del branco di pixel che avete. Ora stai scavando il più grande tasso di bordo nell'albero di spanning minimo. Definirete la dieta come differenza interna. In una certa misura che sarà il più alto tasso di bordo in quella regione. E'solo un modo semplificato di dire che è un punto che se si va a definire un'altra quantità, se si va a definire è per minima differenza interna, la differenza minima interna è data da se si hanno due regioni, C1 e C2. La differenza minima interna tra queste due regioni è data da un minimo della differenza interna di C1. Plus è una qualche penalità scelta manualmente. Quindi, uh, lo spiego in un attimo. E poi la seconda quantità è la differenza interna di C2 e Well appena essendo, vedendo il numero di pixel che si ha nella regione, magari normalizzarsi in base a quello o così via, che abbiamo una quantità e si prende il minimo di quello che è questo punto. Abbiamo una regione, una per la quale lo definireste in cambio di dollaro. Più qualche penale regione C2 che fa la differenza intelligente, ed è una specie di spuntino migliore. Io prendo il minimo di questi studenti. Una volta che lo si ha anche per qualsiasi, proprio nelle regioni, che sono almeno un bordo che collegano una qualsiasi di esse. Ciò che fa, abbiamo definito una quantità chiamata diff di C1, C2, che è data dal bordo di peso minimo, collegando queste due regioni. Quindi per esempio, si considera tutto solo uno. Facciamo tale che vogliamo provenire da Regency uno. E anche noi veniamo da un'agenzia. Quindi tutte le età tra quelle due regioni e si prende il peso minimo dei bordi che collegano queste due spiagge con questa quantità è definita. Il metodo definisce un predicato D per qualsiasi due regioni, C1 e C2 pass. Se diff C one e sequel è maggiore della minima differenza interna tra C1 e C2, allora dici che è vero. Altrimenti dici che è falso. Questa illustrazione dovrebbe aiutarti a capire questo un po' meglio. Diff è il tasso minimo di bordo tra buoni agenti, ma noi minima differenza intollerante. È una differenza minima intelligente all'interno di ciascuno di questi, tra C1 e C2, qualunque sia il minimo. Quindi se la differenza tra le due regioni è maggiore della minima differenza interna, non si vuole fare nulla. Se è il contrario, le regioni sarebbero marchiate. Questo previsto si scopre falso. Insomma, quel diff è uguale o minore della minima differenza ad interim, il che significa che C2 è vicino a C1 come i pixel separati più lontani in C1. Così anche tu puoi anche tu, Mudge C1, Pensacola. Questa è l'idea principale con questa metrica particolare. Così, uh, per riassumere questo algoritmo unisce ogni due regioni. Chi fa la differenza è più piccolo del minimo in dollari di differenza di queste due regioni. Questo è un esempio di come questo funziona utilizzando il quartiere di otto pixel. Così si vede che i risultati sono abbastanza buoni. I diversi giocatori si separano, ragionevolmente bene. Parti del corpo si separano ragionevolmente. Se avete più che distinti questi look al capitolo 5,2 0,4, invece del libro di sci, il prossimo metodo che analizzeremo è un altro metodo popolare o di aggregazione probabilistica, proposto da Alport nel 2007. Questo metodo è di nuovo, un algoritmo di matching di regione ed è un approccio probabilistico. Come dice il nome, uso questo tipo di valori di intensità QS per i valori di livello di grado. Oltre ad alcuni contenuti texture di no, una specifica regione nell'immagine. Così inizialmente il metodo considera ogni pixel come una regione, e poi si assegna una verosimigliante probabilità B IJ. Quindi per ogni due pixel, io e J c'è un maiale di verosimigliante, che è quanto probabile siano questi due pixel troppo. E come si assegna quella borsa basata su quell' intento, l'intensità e la consistenza. Un sacco di questi, non andrai in ognuno di quei dettagli. Ti indico il riferimento. Se siete interessati a sapere come si attua esattamente, potete guardare la carta per quei dettagli, ma è ampiamente basato sull'intensità. Sai, come l'intensità computa ormai, non hai la consistenza del computer. Ne abbiamo parlato l'ultima volta. Così il maiale si basa su intensità e similitudini texture. I due pixel. Ora, dato un grafico in una particolare iterazione, diciamo che è un X meno uno. La titolazione poi si spezza è data da un set di cosa è questo? V S meno uno ed E come il mio era uno. Così il golf della prossima iterazione, GS, quando si spera di Mudge qualche regione è, è una cosa morsa. Si considera un sottoinsieme di nodi di semi, C. Da V S meno uno. E voi notate o regioni, se sono fortemente accoppiate alle regioni in, vedere, vedere cosa stiamo facendo qui è che considerereste quei pixel. Quindi il che significa che diresti che se hai preso un sottoinsieme di nodi in vs meno uno Riccardo altri appunti, giusto? Saremmo idealmente considerati altri appunti, che sono in V S. Minus uno meno C. Quelli sarebbero gli altri pixel nella S meno uno. Si considerano quei pixel. E per qualunque pixel abbiate V una sommità S di VIG, Giacobbe appartenente a C diviso per sommità J appartenente a V S meno uno meno CPAG. Quando c'è una questione è più grande della soglia, si sa, che ci sono certi pixel. Che molto probabilmente sono i pixel in, nei semi della regione. Quindi questo rapporto è grande. E poi la soglia, che la carta raccomanda di fissare 2,2, poi unire quelle legioni. E una volta unite quelle regioni, si propagano quelle assegnazioni. Ma i bambini di livello finale, che sarebbero di proprietà di qualsiasi regione a guardare, li chiamerò. E tu fai questo processo. Sì. C'è un esempio di come funziona in pratica l'aggregazione probabilistica. Così si tratta di un'immagine presa da Selinskij il suo libro. Così potete vedere qui che immagine a è la griglia di pixel del grade-level. Quindi è un cinque di cinque immagine. Così si possono vedere gli interi accoppiamenti di pixel in immagine B. Quindi un bordo spesso significa un accoppiamento più forte, un bordo sottile significa che possiamo agganciarci. Così si può vedere che i pixel che sono bianchi sono fortemente accoppiati l'uno all'altro a causa della somiglianza di intensità. Non ti hanno visto eseguire un solo limite, ovviamente, seduto dove si combinano i bordi che sono vicini l'uno all'altro. E proprio che tu prenderesti un pixel particolare e inizi quello, che sarebbe C. Poi prenderesti tutto l'altro V meno uno, meno C uh, di tutti gli altri pixel in V S meno uno, meno C. E poi proveresti a scoprire quale di essi ha una maggiore probabilità di margine basato su intensità, somiglianza e texture di nuovo, e poi continui a ripetere questo processo. Si vede che dopo due livelli, ovviamente, si ottiene una stima abbastanza buona di regioni diverse nell'immagine. Beh, passiamo ad un altro metodo popolare noto come segmentazione media di turno. Questa materia è un approccio diverso e utilizza una tecnica più ricercata in base alla stima della densità non parametrica. Quindi la stima della densità non parametrica è uno standard a zipper che le persone in apprendimento automatico utilizzano per stimare la densità di qualsiasi data serie di osservazioni. Quindi i vettori di funzione di ogni pixel nell'immagine dello zoom sono alcuni campioni di qualche distribuzione di probabilità sconosciuta. E stimeremo la funzione di densità di probabilità al di fuori dell'immagine e la troviamo più, in un certo senso, i confini sarebbero come quello che ci nascondiamo per la segmentazione impermeabile. Anche se in quel caso abbiamo fatto un minimo. Ora parleremo di un massimo. E poi l'immagine è finalmente segmentata. Una volta identificati i corti nell'immagine, l'immagine è segmentata pixel Weiss considerando ogni insieme di pixel, che scalano per non sembrare più un segmento coerente. Potete descrivi questo per le prossime slide. Consideriamo quindi un'immagine di esempio come potete vedere qui. Quindi è un'immagine mondiale abbastanza reale sulla destra. Vedi la presentazione del match. Così abbiamo parlato di spazi di colore in settimana uno. Così uno degli spazi di colore che si discute popolarmente è conosciuto come la stella di partenza che iniziamo, o lo spazio a colori lub. Quindi questo è semplicemente per semplicità di trama di solo lo studio malato. Si iniziano le funzioni di questa immagine solo per semplicità di complotto. Quindi in questo spazio di funzione, idealmente vogliamo scoprire quali sono le modalità della distribuzione complessiva delle intensità alla fine, a partire dallo spazio stellare. Allora come si trovano le modalità di una tale distribuzione? Sì. Ah, la chiamata, i tuoi studi e il machine learning. Si ricorda che uno dei popolari approcci di upload per stimare la funzione o le modalità di densità della proprietà? Sarebbe attraverso il killer. Questa è la stima. Quindi useranno lo stesso metodo qui per poter stimare quello che è il PDF e quali sono le modalità di distribuzione delle intensità in un determinato spazio. Perché abbiamo preso esempio come spazio utente finale, si potrebbe fare un tale ritrovamento in qualsiasi altro spazio anche per quella materia, solo per semplicità, si va a considerare un esempio dimensionale. Quindi ricordate, ancora una volta che si tratta di un segnale bidimensionale. Che può essere estrapolato all'immagine come segnale di dovere. Quindi il modo in cui stimavamo questa funzione è che la convertiremmo. Oh, i dati supponiamo che tu abbia delle osservazioni date da questi impulsi. Così potete vedere quelle linee verticali, Louisa, le vostre osservazioni, quell' argomento. Quindi stimeresti la tua funzione di densità F che è ciò che vogliamo stimare convertendo i tuoi dati, le tue osservazioni. Con qualche tipo di botola, supponiamo che tu abbia una pistola sulla torta. Quindi potresti farlo come una funzione di caduta in calo dove hedge è il wit e hai X minus X per essere, uh, la tua funzione, la tua funzione genetica che stai cadendo o così cambogiano le tue osservazioni con questo contenti. Ti diamo una stima. Qual è la tua funzione? Questo era che le tue osservazioni arrivavano. Che cosa facciamo con questo? Quindi per trovare le modalità significano, la segmentazione a turni utilizza un metodo ascent gradiente con più riavvii. Perché non perché vogliamo trovare il massimo di tutte le modalità di quella distribuzione di probabilità. Iniziamo quindi con alcuni ospiti, perché non per un massimo locale. Potrebbe essere solo un qualsiasi punto. Ricordati quando eseguire. Ascesa gradiente, che è una procedura iterativa. Quindi si inizia con un certo punto e poi ogni, ogni iterazione si aggiunge qualche volta costante il gradimento alla stima precedente e si aggiorna di nuovo la stima e ancora e ancora. Quindi hai un'ipotesi, perché no? Che potrebbe essere qualsiasi punto casuale scaduto. Calcoliamo quindi la densità o il gradimento della stima di densità F di X. Abbiamo appena parlato di come se influito viene calcolato usando quel killer. Uh, come scegliere quel contenuto? Ne parleremo in un attimo. Quindi si ha il gradimento della stima di densità F di X, perché no? E facciamo un passo ascente in quella direzione. Così il gradiente sarà dato da qualcosa come questa sommità estiva meno X, G di questa quantità, dove G non è altro che K prime, tutto il derivato della torta al funnel, semplici limitatori. Quindi il gradimento della funzione di densità può effettivamente essere scritto leggermente diversamente. Si può scrivere di nuovo il gradiente, vediamo la luce precedente. Così questa è stata la griglia che abbiamo appena digitato l'eccitazione è X nella G di X meno le norme estivi inquadrate dalla testa quadrata. Quando G è K prime meno K prime o il gradimento del colore. Quindi dobbiamo dimostrare che questo può effettivamente essere scritto leggermente diversamente. Dove il gradiente può essere ad una stima, G capital G di X meno eccitabile. La maiuscola G di X minus excite è semplicemente la stessa piccola D che abbiamo visto sulla slide precedente in MX MX è come un contributo ponderato dei valori X che state considerando in questa particolare competizione. Così eccitato nella G di X meno entusiasmante. Diviso per somma di tutte le dimensioni G di X meno X. Perché si tratta di un modo corretto di scrivere dalla slide precedente? Vuoi lasciarlo a te per i compiti? Non è la figura a scoprirlo, ma io lo lavoro fuori stepwise e riceverai in realtà la risposta. Così questo vettore X, che corrisponde al gradiente è noto anche come il mutato medio. E'la differenza tra X, scusa, se tu, uh, non ti ho fatto segnare questo meno X, ma, uh, è il turno principale è la differenza tra X e la media ponderata del gradiente dei vicini intorno a X, X è molto soddisfatta. Gli occhi Frito e X minus X sono i valori della gamma di quel filtro. E si guarda alla soluzione molto simile a come risolviamo la convoluzione prima. In questo caso stiamo parlando solo di una deconvoluzione per semplicità. Così il vettore MFX è il turno principale. La differenza tra X e la media ponderata del gradiente dei vicini. E una volta ottenuto il tuo turno principale, che è anche il tuo gradimento in questo caso particolare, un soggetto è stato ridimensionato più volte. Poi la tua prossima iterazione nella tua discesa sfumata, la tua ascesa sfumata. Si dirà perché il tasto plus uno è uguale a Y K plus M di YQ. Si può anche incontrare nello stesso. Avremmo solo un Waikiki ed esperto di cancro perché è lì che si sta posizionando Waikiki in questo momento. E sarai lasciato solo con Emma Viking come la quantità, che diventerà YK plus, che diventerà YK plus model. E continuate a fare questo processo io creativamente e raggiungete finalmente il più della distribuzione. E poi scoprirete tutti i punti vicini, che per arrampicata porterebbe a questo centro commerciale formerà un segmento, altri punti, che rivendicando arriverebbero ad altre modalità. Ciò che quei segmenti, chiaramente questo metodo si affida alla selezione di noi adatti al cardinale wit oltre al Cosa con il tuo succo è importante e l'impatto, il dessert finale e che viene scelto. E in particolare nella descrizione, l'approccio sembrava basato su colori. L'abbiamo preso nello spazio U B. Si possono anche considerare altri tipi di caratteristiche di altri tipi di spazi futuri per trovare le stampelle. Fantastico. Si prega di guardare il capitolo 5,3 0,2 in qualche libro di sci. Un momento, che non è un metodo di matching della regione, ma un metodo di suddivisione della regione è normalizzato per la segmentazione. Ancora una volta, un metodo molto popolare è stato usato per molti anni, un secondo, un metodo grafico basato, ma un approccio diverso in questo caso, un grafico che rappresenta i pixel in un'immagine. Si suddivide in parti. Non si tratta di marciare questa volta. Si tratta di split. Come si fa a dividerlo? Contrassegnare i tassi di pregiudizio tra i pixel in base alla similitudine, una sorta di due pixel sono molto simili. Forse hanno intensità simili. Si dà loro un alto tasso di bordo. E se due pixel sono più distanti in una somiglianza, si dà loro peso basso. Ecco allora un esempio di un tale grafico che è costruito. Quindi l'obiettivo di questa sarebbe la multa, il taglio principale. Non sei disposto a lavorare l'intero materiale. Se sei investito, puoi guardare le differenze e saperne di più. Ma state cercando di trovare la tazza principale, che vi darà due regioni diverse come qui mostrate. E quei bordi, quando ti rimuovi ricevi i corrispondenti due segmenti, che è il tuo obiettivo finale. Il taglio principale è definito come alcuni di tutti i pesi che si trovano a proprio agio. Quindi si considera due serie a e B due insiemi di ciò che è. E per tutto quello che appartengo a un e J appartenente a B aggiungi quei tassi di bordo, ovunque tu abbia ottenuto per il quale hai una scelta di un e B si ottiene un valore minimo di taglio. Ecco l'auto che scegliete per dividere il grafico in due segmenti. Così chiaramente come potete osservare qui, questo metodo divide solo due segmenti alla volta. Quindi se vuoi più segmenti, dovremo farlo sempre più volte, o probabilmente useremo altre euristiche. Se si voleva combinarli in seguito in meno segnali. Ma uno dei problemi con l'utilizzo del mini carrello è che può anche tradursi in soluzioni precedenti. Perché il sapone, ci pensi? Perché questo problema della carta principale inizia nelle soluzioni di tributo? Ok. La risposta è molto semplice quando consiste in un solo pixel. E B consiste in un'altra regione di pixel, questa sottomissione, forse la più severa su un set più piccolo e da qui potrebbe avere un valore più piccolo quando si somma tutti, il che significa quando potrebbe favorire regioni in cui c'è un solo pixel su un sito, cosa che potrebbe non essere, che potrebbe semplicemente essere un outlier e potrebbe non costituire davvero una buona segmentazione per l'immagine. Come si fa a superare questo problema? Questo problema viene superato da un metodo o normalizzato, che migliora il problema della scheda principale. E la normalizzata è definita da scheda di AB per associazione di AB plus cut di AB per associazione di DV. Vedremo cosa sono. Associazione viene definita di nuovo, come somma di tutti i pesi in un e B, dove l'associazione di AB è data da associazione di AA plus associazione di AB è la somma di tutti i pesi. E ora quello che hai fatto facendo questa associazione di AB e associazione di BB è due. Assicurarsi che il denominatore contenga il numero di immagini. Quindi, in ognuna di queste, in ognuna di queste regioni, quindi se c'era un solo pixel in una sola regione, ricordo che una di queste quantità diventerà molto alta come contro un'altra regione, che sono molti più pixel. Quando il denominatore tirerà giù il menu. Questo assicura che non si ottengono soluzioni rivelate come quello che avete visto in me, ma si ottengono soluzioni più utili nella pratica. Così l'intestino realizzato capita di essere un problema completo da MP, ma le soluzioni approssimative per risolvere questo leggermente più in guerra. Eh, ma puoi guardare le persone o normalizzare le segmentazioni ematiche. Se siete interessati a come la materia è in realtà implementata. Che questa fosse la formulazione orale che aveva come esempio di come funziona la coppa normalizzata. Ecco quindi l'immagine in ingresso, e si possono vedere le varie regioni diverse ottenere che si segmentano usando delle buche normalizzate o le iterazioni del metallo. Ok. E molti altri metodi per la segmentazione med fanno come semplicemente usare k - significa clustering che sono stati anche metodi basati su Mark, su campi casuali e campi casuali condizionati. E molti di più. Se volete avere una comprensione dettagliata, vi preghiamo di leggere il capitolo cinque del libro di sci d'argento che un motore recensa anche alla fine di questa lezione. Ma la domanda che la gente chiede ora è. Abbiamo davvero bisogno di tutti questi metodi di segmentazione. Quindi pensate che l'intero corso sia basato sul deep learning per la visione del computer. Non ci sono metodi di apprendimento profondi che possono segmentare il ministero. Hai davvero bisogno di tutto questo. Si tratta di una domanda valida per molti compiti oggi. Non hai bisogno di questi metodi. Lo scopo di coprire questi argomenti è quello di darvi un contesto di visione del computer nel setup della pianificazione 3d. Ma alcuni di questi metodi sono stati utilizzati anche nell'era dell'apprendimento profondo. Per chi di voi è un po' più consapevole di queste aree, I precedenti metodi di deep learning utilizzati per il rilevamento degli oggetti, che significa dare un'immagine, state cercando di trovare un oggetto e disegnare la casella di bounding come a dove l'immagine, quell' oggetto si trova. Questo è il compito di rilevamento. E potrebbero esserci più istanze di oggetti o più oggetti in un'immagine per i metodi iniziali di deep learning per il rilevamento degli oggetti. Si trattava, uh, di questi tipi di metodi di segmentazione che in realtà erano soliti generare quello che il Vermont ha scritto proposte, dove gli oggetti potevano, come, come dicevo, uno dei primi us CNN, che è una Reggenza e, e quello che è stato usato per l'individuazione degli oggetti utilizza il metodo di segmentazione della carta principale noto come CPMC vincolato, tagli principali parametrici per generare proposte scritte per segnali full - soffiati. Parleremo di quelli in dettaglio quando arriveremo a quella sezione della scuola. Ma questo è il motivo per cui, uh, la segmentazione delle immagini è utile per conoscere in questo momento, la segmentazione può anche andare oltre le immagini in video.