Loading
Note di Apprendimento
Study Reminders
Support
Text Version

Associazione tra Variabili numeriche

Set your study reminders

We will email you at these times to remind you to study.
  • Monday

    -

    7am

    +

    Tuesday

    -

    7am

    +

    Wednesday

    -

    7am

    +

    Thursday

    -

    7am

    +

    Friday

    -

    7am

    +

    Saturday

    -

    7am

    +

    Sunday

    -

    7am

    +

In questa lezione, studiamo Associazione tra variabili quantitative o variabili numeriche. Nella precedente coppia di lezioni abbiamo esaminato l'associazione tra variables.Now, si estendiamo; analizziamo misure come Chi square e Cramer's V per variablesand categoriali cercheremo di scoprire quali sono le misure equivalenti, se guardiamo a quantitative o numericalvariables.Now, analizziamo alcuni dati e diciamo che stiamo cercando di guardare all'associazionismo tra stipendio e risparmio. Quindi, abbiamo 2 variabili; una è il Salario della persona e l'otheris il risparmio della persona. Quindi, una delle variabili agisce come variabile x o la variabile xasse e gli altri atti variabili come la variabile y o l'asse y variable.Quindi, generalmente, la variabile esplicativa è la variabile asse x e la variabile di risposta è la variabile asse y. Così in questo esempio possiamo supporre che lo stipendio sia il motivo del risparmio perché le persone ottengono reddito e stipendio da cui si assapore.Perciò il risparmio diventa la variabile asse y e lo stipendio diventa l'asse x variable.Quindi, supponiamo di avere circa 100 pezzi di dati per lo stipendio e risparmiare per un paio di x, y; dove, x è lo stipendio e y è il risparmio. E supponiamo di avere complottista questo e questo è quello che otteniamo se tracciamo questi 100 pezzi di dati ogni dato avente una x anda y value.Now, la stessa foto viene mostrata sul lato sinistro e lasciateci guardare. Ora, letus fa altro e poi, abbiamo iniziato con centinaia di serie di dati, ogni data havingente x e ogni dato che ha una y. Ora supponiamo, abbiamo rapidamente randomizzato la x e la y nel senso, semplicemente facciamo rapidamente una sorta di scatto casuale di x e poi casual tipo di y che meansora con i nuovi dati, la x e la y non sono esattamente come sono stati accoppiati in questi dati andammo comunque a 100 coppie con x e diverse y. Diciamo cortesemente cortesemente choc e poi traltiamo che usando questo e otteniamo questo tipo di plot.Quindi, questo è il dato look e questo è il casuale. Ora la prima impressione è che i dati siano molto diversi da quelli casuali e quindi, la prima impressione è che ci sia associazione tra queste 2 variabili, se si assomigliano o sembrano ragionevolmente somiglianti all'occhio. Poi, si potrebbe dire che non c'è associazione. In questo caso si trovano diversi e quindi, possiamo dire che c'è associazione. Quindi, quanto diversi e allatti dipendono da come comprendiamo le foto. Ma sono sicuro, la maggior parte di noi sarebbe d'accordo sul fatto che queste 2 foto non sono simili; sembrano diverse e quindi, c'è qualche associazionismo tra lo stipendio e il saving.Now, come descriviamo l'associazione in termini di molte cose. La Tendenza. Quindi, c'è l'anasca o un'associazione al ribasso, il che significa che x aumenta così l'aumento o come x aumentare così la diminuzione. Potremmo guardare Curvatura che significa è lineare, è una linea di raddrizza o mostra una curva e poi, guardiamo le variazioni sono punti strettamente clusteredlungo la linea. Sono più lontani e poi, ci sono degli outlier; ci sono punti che non dovrebbero essere appartenenti completamente, ci sono sorprese e così via? Quindi, cercheremo di guardare alcuni di questi in questa lecture.Ora, se guardiamo un'altra serie di dati sullo stipendio contro il risparmio e diciamo a tisi come i dati appaiono con x come lo stipendio e la y come la variabile di risposta che è il risparmio. Ora se proviamo a fare la foto randomizzata di questo, dove abbiamo ancora 100 punti, ma i x e y sono ormai ordinati completamente casualmente il che significa che non hanno la coppia x y e quando facciamo un esercizio simile, ecco come appaiono i dati originali. Ecco come appaiono i dati randomizzati. E sembrano diversi? Forse non lo fanno; insomma se lo guardiamo con molta attenzione si potrebbe dire che sembrano diversi; ma toll'occhio, si potrebbe avere la sensazione che entrambi sembrano un po' clutati e qui, potremmo concludere che in realtà non c'è associazione tra questa o pochissima associazionismo tra this.So, abbiamo se nell'esempio precedente abbiamo visto che c'è una grande differenza. Allora, abbiamo detto che qui c'è associazione non c'è tanto differenza. Allora, abbiamo detto che forse non c'è tanta associazione. Ma poi, come facciamo a compaggiare c'è una misura o una metrica che ci dice che c'è associazione o non c'è associazione tra queste variabili; vedremo quelle matrice mentre ci spostiamo along.Now, per fare questo ci facciamo prendere questo tipo di dati e poi, proviamo a tracciare la barra degli x bar andy e che viene mostrata in questa foto. Questo punto è il nostro x bar y bar che possiamo calcolare.Ora abbiamo già visto questa misura chiamata Covarianza. Così, visitiamo di nuovo la Covarianza. Covarianza quantifica la forza dell'associazione lineare tra due variabili numeriche. Si misura il grado a cui i dati si concentrano attraverso la diagonal.Così, dato x 1, y 1 e x 2, y 2 e una barra x, y bar la covarianza è data da x meno xbar in y minus y bar per n. Ho anche sollevato una domanda è n o è n minus 1? Wecan si assume n e successivamente quando scopriamo correlazioni e altre misure, usiamo costantemente lo stesso denominatore in modo che non ci sia bias nel calcolo. Così, usiamo n in questo case.x meno x bar in y minus y bar per n è la covarianza tra questi due. Ancora, nella stessa foto, dove vengono mostrate le medie, quando facciamo questo il primo pittoresco quando abbiamo questa foto che torniamo a questo, questo è il dato originale e la tisis il casuale. Così, torniamo a questa foto e poi, cerchiamo di scoprire x bar e y bar.Così, in questa foto x bar è 125523 e y bar è 31978. Nella foto casuale x baris 113403 e y bar è 14382. Questa non è la foto casuale. Si tratta della seconda serie di dati. Quindi, torniamo indietro, questa è una serie di dati; questo è data set 1 e lascia che di ussay questo sia il dataset 2 e potete vedere queste 2 foto qui di seguito. Questo è il dataset 1 che si riflette qui e questo è il nostro dataset 2 che è qui ampliato a questo. Pertanto, mostrano diversi x bar e y bar, se vi fossero stati gli stessi dati e la random la barra x e y non cambierebbe perché servirebbero gli stessi 100 valori. Pertanto, questi due rappresentano due diverse serie di dati. Questo si chiama data set 1; questo si chiama data set 2.Now, x bar è 125523; x bar è 113403 perché il dataset è diverso. y bar è 31978; y bar è 14382. Quindi, se troviamo la covarianza di entrambi sigma x meno x bar in y minus ybar n; sommazioni per tutti i valori 100, la covarianza nel primo caso diventa 6282326586.The covarianza nel secondo caso è di 527175843. Quindi, che ha una covarianza superiore?Calcoliamo rapidamente il numero di cifre e poi, realizziamo che ci sono 10 digitsina questo numero e ci sono 9 cifre in questo numero. Pertanto, questo mostra covarianzamaggiore rispetto a questi dati. Allora, cosa facciamo fuori da questi numeri? Generalmente quello che cantiamo è se la covarianza è più alta, ci potrebbe essere qualche associazione con i dati andtra da dati confrontabili quella che ha una covarianza superiore sembra avere associazione.Quindi, per la prima serie di dati x bar è 125523; y bar è 31978. La covarianza è di 6282326586 andallora, calcoliamo la deviazione standard di x che è S x è 148035; S y è 44851,54. Quindi, qui compare anche la deviazione standard di x e la deviazione standard di y. Ora, calcoliamo la correlazione. Quindi, la correlazione è uguale alla covarianza divisa per il prodotto di standarddeviazioni. Quindi, covarianza di S x S y; quindi, 6282326586 diviso per 148035 in 44851.54which è di 0,9462. Quindi, la correlazione per questo è di 0,9462. Abbiamo già studiato il correlcoefficiente e il suo calcolo. Quindi, ora lo stiamo facendo ancora una volta per fare la doccia che la correlazione è del 0,9462. Ricordate anche che la covarianza può essere negativa, abbiamo visto sventare una lezione precedente; mentre, le deviazioni standard sono rigorosamente non negative, sono either0 o positive. E perché, il coefficiente di correlazione è la covarianza divisa da una quantità positiva, avremmo la correlazione anche come quantità negativa, così come la quantità positiva.La gamma è compresa tra meno 1 e più 1 e in questo caso abbiamo una correlazione di 0.9462which molto vicina a 1 e poi, potremmo dire che i dati sono effettivamente associated.Ora, se guardiamo a questi dati la seconda serie di dati. Prima di lasciarci guardare a thesecorrelazione misura la forza dell'associazione lineare tra variabili numeriche. Whatis importante è l'associazione lineare tra variabili numeriche. r è sempre tra minus1 e più 1 e r non ha unità. La deviazione standard ha unità. Così, S x ha un'unità inquesto caso i suoi soldi o rupees.S y ha anche unità che sono soldi o rupie e poi, torniamo indietro facciamo i prodottidi S x e S y. Quindi, è rupie piazza o piazza del denaro. Covarianza è x minus x barinto y minus y bar per n summation. Quindi, ha anche il quadrato di moneta e quindi, la correlazione non ha un'unità. Si tratta di un'unità in meno quantità che è compresa tra minus1 e più 1. Quindi, quando guardiamo la seconda serie di dati x bar è 113403; y bar è 14382; S di x è 134858; S di y è 44243,6. La covarianza è di 527175843 e quando calcoliamo la correlazione, troviamo il punto 0,088. Quindi, la correlazione è chiusa a 0 e quindi, non c'è associazionismo o pochissima associazione tra stipendio e risparmio in questo case.Now, guardiamo un altro esempio, dove abbiamo l'età della persona contro lo stipendio e diciamo che abbiamo prelevato questi 10 punti e poi, prima trattiamo questi 10 punti. Quindi, questi punti questi 10 punti sono tracciati. Otteniamo una trama di dispersione di questi 10 e poi, diciamo che ci si adatta anche ad una linea attraverso un software che possiamo fare e che vuoi controllare e che poi vogliamo fare una domanda c'è un'associazione positiva o c'è una negativeassociazione da questi dati? La linea sembra dire che ci sia un lookslike almeno per i dati che abbiamo guardato, c'è un'associazione negativa tra il betweenage e lo stipendio. Perché ciò è dato anche da un coefficiente di correlazione computato di minus0.22705. Ora, c'è un outlier di cui possiamo pensare bene e fuori, risponde a tutte le 4 domande che abbiamo guardato. Quindi, c'è un outlier in questo esempio: è anche possibile trovare la correlazione quando abbiamo più di 2 variables.Quindi, abbiamo l'età, abbiamo l'altezza e abbiamo peso. Diciamo che abbiamo questi dati per il bosetto il gruppo di età da 11 a 20 anni e diciamo che abbiamo prelevato una persona con l'età di 11 anni; una persona con età 12 e così via e che è rispettivamente l'altezza e il peso. Quindi, la correlazione tra età e età, età e se stessa è di 1. Così, in questo esempio, possiamo calcolare la correlina tra età e altezza che funziona fino a 0,9015 e si può fare il resto di essa correlazioni tra altezza e altezza è anche il 1 e la correlazione tra peso e peso è anche di 1. La correlazioni tra età e altezza è la stessa di correlazione tra altezza ed età e quindi, la matrice sarà una matrice simmetrica con 1 tra le diagonali. Quindi, in modo efficace è enoughto trovare solo 3 numeri; età versus altezza, alto versus peso e età versus peso. Similare esercizio fisico, si può fare che diciamo i segni ottenuti in 3 soggetti; Matematica, inglese e Scienza da parte degli studenti delle scuole superiori. Quindi, potremmo farlo e abbiamo couldintegrale questo table.Now, guardiamo un'altra serie di dati. Così, qui guardiamo l'età che viene data qui e lo stipendio è dato anche qui. Un'altra serie di dati. Quindi, abbiamo fatto correlazione e la correlazione di weget è pari a 0,8806. Quindi, se ci mettiamo una linea, mostriamo la linea che è fitta qui e questa linea come ho accennato anche in una lezione precedente ha qualcosa di calledr quadrato che è una bontà di adattamento che è 0,7756 e poi, ci rendiamo conto anche che la piazza thisr è in realtà quadrata del coefficiente di correlazione di 0.8806.So, 0.8806square diventa 0,7756. Ma tutto questo è vero solo se decidiamo di inserirci una raddrizza questa associazione. Se ci si adatta a una curva allora, dobbiamo avere diversi tipi di associazione. Abbiamo già visto che la covarianza o la correlazione è una misura di associazione lineare betweennumerical variables.Quindi, la correlazione misura la forza dell'associazione lineare tra le variabili. Più r assolutevalue di r diventa più vicino gli ammassi di dati lungo la linea, possiamo usare r per trovare l'equitazione di questa linea e possiamo prevedere y per un dato x. Possiamo fare tutto questo quando abbiamo il correlcoefficiente. E se consideriamo il punteggio z, non siamo ancora arrivati nel dettaglio su z score, ma z score sono le deviazioni dalla media divisa dalla deviazione standard correlazioni converte il punteggio z di una variabile nella z square di un'altra variable.Così, ci sono queste matematiche che ho dato le equazioni che ho dato. Quindi, z x è x minus x bar per S; z y è y meno y bar e poi, possiamo avere l'equazione della linea è z bar y è uguale a r in z x e da questo possiamo ottenere un e b che areano con la linea. E stiamo solo mostrando questi calcoli. Quindi, di nuovo la correlazione thisdata è di 0,8806. Quindi, è possibile utilizzare questo calcolo da x bari bar S x S y e r e da questo, possiamo rapidamente ottenere b che è 9473,28 e poi, wecan get a che è meno 222495 e se effettivamente ci siamo adattati che usando la linea su un software usinga arriveremmo a 9473,8. Abbiamo ottenuto 9473,28 secondi nel nostro calcolo, una piccola approssimazione 222514 è stata calcolata come 222495. r quadrato era di 0,7756 correlazione è 0.8806.A mostrata foto simili e qui, ho effettivamente mostrato come ci sono le curve e queste curve sono adatte anche a questo tipo di dati. Ma ci limiteremo a linearassociation. Ma dobbiamo capire che l'analisi per r è solo per l'associazionismo lineare tra i these.Now, dobbiamo anche capire una cosa con la quale la guardiamo attraverso un anodo di dati. Ora, mostriamo 2 serie di dati. Supponiamo che si tratta di punteggi CAT di punteggio di 6 studenti e diciamo che questi sono dati che corrispondono ai punteggi fatti bya cricketer in 6 vincite. Quindi, potremmo trattarne uno come x variablee potremmo trattare l'altro come una variabile y e poi, se applichiamo solo il Math e cerchiamo di trovare la correlazione che otteniamo r è pari a 0,7834. Quindi, se non vi avessi detto che questa serie di variabili rappresentano lasciarci dire dei punteggi CAT e questo insieme di rappresentazioni variabili fatte da un giocatore di cricket e se semplicemente mi ero trattenuta questo e avevo semplicemente chiesto di trovare il coefficiente di relazione? Riceverai 0,7834 e se avessi chiesto la domanda c'è l'anassociazione? Poi, si potrebbe dire di sì, c'è una correlazione ragionevolmente elevata. Forse c'è un'associazione tra questa x e questa y.Ma il momento in cui diciamo che questo rappresenta il punteggio di CAT e questo rappresenta le piste realizzate da un giocatore di cricket. Quindi, ci rendiamo conto che non c'è bisogno di essere e non sarà un'associazione.Quindi, una migliore conoscenza delle variabili può aiutarci a capire la causale. Quindi, scatter plotsand correlations rivelano associazione. Donano ci dicono causale. Ad esempio, theydonot racconta che se questa è la variabile x; poi, calcolo la variabile y, posso applaudire e calcolare un numero. Ma quanto io interpreto bene il numero dipenderà dalle variabili che stiamo studiando ed è importante conoscere quelle variabilissime prime, prima ancora di tentare di trovare c'è una causa ed effetto tra queste 2 variabili?Ma proprio da soli senza definire cosa sono queste variabili, se c'è un'associazione; sì, c'è un'associazione con l'alto valore di r.Quindi, con questo completiamo questa lezione e nella lezione successiva cercheremo esempi sommici di associazione tra variabili numeriche dopo le quali inizieremo a studiare con probabilità ulteriori dettagli. In questa lezione continuiamo a discutere di associazione tra numeriche variables.Così, analizziamo alcune domande di esercizio, cerchiamo di capire ulteriormente i concetti e poi sintetizzeremo ciò che abbiamo imparato nelle lezioni del 11 e cerchiamo di concludere la discussione sulle statistiche in questo corso e poi andare avanti per fare probabilità e avviare modelli per probabilitànella prossima lecture.Così, abbiamo esaminato l'associazione tra variables.Così, abbiamo esaminato la covarianza come misura di associazione, abbiamo anche detto che covariancecan sia negativo e poi dalla covarianza ci siamo passati a descrivere la correlcoefficiente, che sembra una misura più compatta perché assume valori di betweenminus 1 e più 1.And perché la covarianza è negativa e le singole deviazioni standard sono positive, correlcoefficiente può anche assumere valori negativi tra meno 1 e più 1.So, con questo ci facciamo passare ad alcune domande alcune vere o false domande, l'asse x della trama ha anche la variabile esplicativa la risposta è data anche così, la risposta nasce e.Quindi, l'asse x è la variabile indipendente o la variabile che cerca di spiegare qualcosa e l'asse y ora ha la variabile su cui si percepiva quindi l'effetto della variabile esplicabile, x asse ha la variabile esplicativa è vero. Domanda numero 2, la presenza di uno schema indica che la variabile di risposta aumenta in base all'incremento della variabile esplicativa. Quindi, la risposta non è necessariamente vera perché potremmo avere uno schema in cui la variabile x variabile può diminuire così, questo accade quando c'è una correlazioni negativa. Non è del tutto vero, anche se si potrebbe essere tentati di pensare che sia vero perché la nostra mente normalmente ci fa credere che ci sia una correlazioni positiva. Quindi, se c'è un la correlazione positiva allora anche x aumenta y aumenterebbe, se vi fosse una correlazione negativa come x aumenta y diminuirebbe e quindi, questa statementit che la presenza di uno schema indica altro che la variabile di risposta aumenterebbe non è del tutto vera. Terza domanda serve una situazione in cui l'utile netto è circa 10% di thesales.Quindi, la trama della dispersione dovrebbe essere pensata come un line.Quindi, la domanda è ora questa sembra una linea o sarebbe non lineare e così via. Ora l'utile netto è circa il 10% delle vendite ci dà l'indicazione che noi havea line della forma y è uguale a un plus 0,1 x e così via. Roussosimilmente la pendenza può essere pensata come 0,1 e quindi, si può credere che quando westart tracciano questi dati, un tale dato si approssimerà a una linea e quindi, la risposta potrebbe essere vera per questa affermazione. Dichiarazione numero 4, se la correlazione di uno stock con l'economia è di 1, è bene acquistare lo stock quando c'è recesso. Ora, la risposta è fornita qui è falsa perché in quanto lo stock è interamente dipendente da economye interamente correlato con la correlazione di one.So, quando l'economia scenderà anche lo stock sarà calato e quindi dipende da quello che vogliamo fare con lo stock se vuoi scambiarlo molto regolarmente acquistare e vendere thenext day e così via, allora non è una cosa molto buona. Ma, quindi, la risposta è falsa, ma se abbiamo una persona che semplicemente compra la stoccetta ci aspetta che l'economia vada a recuperarla poi la persona vuole vendere poi la risposta è falsa, ma in generale la risposta è falsa perché se l'economia scenderà anche il prezzo di magazzino sarà calato. Domanda numero 5, la covarianza tra i dipendenti e la quantità di produzione è computata con dati giornalieri che ci si aspetta aumento se i dati sono stati aggregati a menù mensili mentre noi aggregiamo i dati ci rendiamo conto che la covarianza aumenta s.Così, queste domande ci hanno aiutato a capire cos' è la correlazione, cos' è la covarianza, e come noi modelliamo una relazione lineare, ci aiuta anche a capire cos' è una spiegazione lineare e qual è la variabile dipendente e così on.Quindi, una semplice domanda trova la variabile esplicativa e la variabile responsevariable.Così, la variabile esplicativa è la variabile x risposta variabile è la y variable.Quindi, dobbiamo guardare queste situazioni e cercare di scoprire quale ha effetto sull'altro o che uno può essere spiegato da qualche altro variable.Quindi, marchi ottenuti in un esame con ore di studio.Così, dato che lo studente mette più impegno in termini di più ore di studio il marchio è previsto per aumento.Così, le ore di studio sono la variabile x o la variabile esplicativa, mentre i marchi obtainedis la variabile y o la variabile di risposta. Numero di lavoratori e quantità prodotte o unità produced.Quindi, qui come mettiamo in più operai la nostra finisce per produrre più quantità.Pertanto il numero dei lavoratori è la variabile x o la variabile esplicativa e le unità prodotte sono la variabile y variabile o la variabile di risposta. Tempo di terza domanda impiegato per eseguire una determinata distanza e il peso di una persona così, è un'assunzione generale che la persona è pesante e ha più peso la persona aspirare più tempo a correre. E quindi, in questo caso il peso della persona può essere la x variabile o la variabile atorevariabile e il tempo impiegato per correre è la variabile di risposta o la variabile y. Totale entrate e voci vendute così, ancora l'assunzione è come vendere più voci o therevenue aumenta o il gettito arriva a causa della vendita di items.Così, gli articoli venduti sono la variabile x o la variabile esplicativa, mentre il gettito totale è la variabile di risposta. L'esercizio ha fatto la quantità di tempo impiegato per fare esercizi e il corpo pesa. Ancora c'è una supposizione generale qui in questa affermazione che mentre trascorriamo più tempo nell'esercizio del peso corporeo si riduce e il peso corporeo ha un effetto sull'importo del tempo trascorso sull'esercise.Pertanto, il tempo trascorso sull'esercizio sarebbe la x variabile o la variabilit esplicativa e il peso della persona sarebbe la y variabile o la variabile di risposta. Sposta alla domanda successiva, correlazione tra numero di clienti e vendite in rupie is0.8 fa la variazione di correlazione se la vendita è misurata in 1000s di rupie. La correlazione non cambia quando è misurata in 1000s di rupie orquando si misurano in tagli equivalenti potrebbero essere addirittura ad esempio, si potrebbe disporre di set dove la vendita è data in rupie e poi si moltiplica per una costante per arrivare in dollari o qualche altra forma di valuta e finché ci moltiplichiamo per la stessa costantla correlazione non cambia .Quindi, se la vendita è misurata nel 1000s di rupie equivale a dividerlo per 1000.So, non cambia. Domanda numero 3, cambio di correlazione se aggiungiamo una costante a una variabile o se wemultipmentato da una costante risponderemo alla prima parte prima e poi la seconda, di nuovo la correlazione non cambierebbe se aggiungiamo una costante a una variabile. Supponiamo di aggiungere una costante alla y variable.Quindi, come aggiungiamo la stessa costante a ciascuno dei valori della y ci assumiamo che la barra degli stantis positive.Quindi, y bar aumenterebbe per la stessa costante e quindi, y minus y bar resterebbe lo stesso in tutti questi cases.Così, quando y meno y bar rimane lo stesso in tutti questi casi, la varianza di y rimane la stessa e la deviazione standard di y rimane la stessa, la covarianza rimarrebbe anche la stessa perché y meno y bar non cambia e la covarianza rimane la stessa, il coefficiente di correlazione rimane lo stesso e quindi, il coefficiente di correlazione rimanda anche a una costante, questa è stata la domanda data nell'avambraccio 2 quando abbiamo detto se è misurata in 1000s di rupees.Quindi, quando moltiplichiamo 1 per una costante diciamo diciamo che moltiplichiamo la x variabile da un costant.Quindi, la x bar viene moltiplicata per la stessa costante, da x bar viene moltiplicato per la stessa costante, le singole x meno x barre si moltiplicano per la stessa costante e quindi, la deviazione standard viene moltiplicata per la stessa costante. E poi la covarianza si fa moltiplicare per la stessa costante, la covarianza viene moltiplicata anche per lo stesso costant.Ora, rispetto alla deviazione standard dato che x minus x bar viene moltiplicato per la stessa costante, quando calcoliamo la varianza ci inquadriamo quindi, diventa squaredella costante e poi per ottenere la deviazione standard prendiamo la radice quadrata e quindi, la deviazione standard viene moltiplicato per la stessa costante, la covarianza si moltiplica per la costante e quindi, il coefficiente di correlazione rimarrebbe lo stesso becausesia e il denominatore si moltiplica per la stessa costante. Nel caso di aggiunta il numeratore e denominatore rimane lo stesso, la theratio è la stessa in caso di moltiplicazione sia il numeratore che il denominatore getmoltiplicato per la stessa costante e quindi il rapporto rimane lo stesso. La domanda numero 4, l'associazione di misure V di Cramer tra o tra variabilit categoriali è utilizzata come misura per le variabili numeriche ora la correlazione può essere compresa tra minus1 e plus 1, ora può Cramer's V essere negativo perché o perché not.Così, qualunque cosa abbiamo visto nelle precedenti lezioni Cramer's V è il valore di chi quadrato divide per minimo il numero di righe meno 1 di colonne meno 1.So, nella V del Cramer è una quantità positiva mentre il numeratore è anche una quantità positiva perché o 0 perché quadrati numberspertanto, il modo in cui abbiamo calcolato il V di Cramer, il V di Cramer non può assumere un valore negativo, il coefficiente di correlazione ha anche un numeratore e un denominatore. parte denominatore che sono le deviazioni standard è 0 o positiva mentre, la parte numeratrice che è la covarianza può essere negativa e poi dicevamo correlis tra meno 1 e più 1, più 1 indica una sorta di associazione positiva e minus1 tipo di indica un'associazione nella direzionalità opposta .Ora, dato che guardiamo le variabili categoriali in Cramer's V controlliamo solo se c'è un'associazione e non qualifichiamo ulteriormente l'associazione per essere positive positivelyassociate o non positivamente associate. Anche perché in variabili categoriali non c'è dubbio differenza tra il valore c'è solo una categoria e quindi, non qualifichiamo più l'associazione aspositiva o non positiva quindi, è giusto che il V di Cramer ci sia un'associazione o meno, ma non prova a dire se c'è un'associazione.Quindi, la V di Cramer assumerà un valore positivo mentre, la correlazione può anche mostrare qualche tipo di associazione negativa. Dieci studenti hanno fatto un test e dopo aver studiato per una settimana hanno fatto un altro test con le sameportions ci fa dire che i segni sono given.Quindi, ci si aspetterebbe questo corso più probabilmente sì perché supponiamo che le whenesse abbiano fatto la prima prova che fossero ancora abbastanza buone e poi lo studio extra li avrebbe aiutati a ottenere un segno leggermente più alto di quello che avrebbero ottenuto nel primo test così, ci aspetteremmo un'associazione.Ora, qual è il rapporto tra i marchi?Possiamo calcolare il coefficiente di correlazione in questo caso e possiamo anche aspettarci che il marksto aumenti e se effettivamente compiliamo il coefficiente di correlazione che si può fare asan esercizio si starebbe molto vicino al 1, penso che in questo caso ne otteniamo circa 0,98 o qualcosa come il coefficiente di correlazione. Lo studente con il punteggio più alto nella prima prova non ha ottenuto il punteggio più alto in thesecond è un'indicazione che non ha eseguito molto bene, in qualche modo la risposta è nella correlazione. Se guardiamo alla seconda colonna il marchio più alto è 78 che viene ottenuto da una persona che got72 nella prima prova mentre, la persona che ottenuto il 77 nel primo arrivato anche 77.If la correlazione era stata un plus 1 allora è abbastanza probabile che ci sarà un incremento di ognuno di loro da quando, non è più il 1 molto vicino a 1.So, queste cose possono accadere, ma sicuramente non è un'indicazione che il personalissimo non ha eseguito bene nel second.Così, con questo arriviamo al termine della nostra discussione sull'associazione tra le variabili numeriche indosseremo appena un minuto per riepilogare quello che abbiamo visto in queste 11 lezioni e con questa 11 lezione completiamo il contenuto del corso sulle statistiche o introduzione alle statistiche, poi dal prossimo lezione ci spostiamo sulla probabilità.Così, abbiamo iniziato con la definizione delle statistiche e cercando di capire perché studiamo questo oggetto e poi a un certo punto abbiamo iniziato a capire i dati e abbiamo anche capito che i dati non sono numeri, i dati possono essere anche testo e informazioni e poi abbiamo imparato a catalogare i dati in 4 tipi di dati e 2 ampi tipi di dati. E poi abbiamo guardato a ciascuna di queste classificazioni dati categoriali e numerici e thentry per identificare misure di tendenza centrale e che per la modalità dati categoriale andif i dati sono ordinali poi mediamente e se i dati sono di intervallo numerico e rapporto, potremmo avere mediamente mediana e modalità e poi abbiamo definito anche deviazione standard e variance.Quindi, potrebbero avere misure di dispersione anche con deviazione standard e varianza. Abbiamo anche guardato per i dati categoriali abbiamo poi esaminato l'associazione e prima di aver esaminato anche la gamma inter quartile se i dati possono essere ordinati e ordinati andpoi abbiamo fatto la gamma inter quartile e abbiamo anche fatto che per i dati numerici abbiamo fatto la gamma interquartile e poi ci siamo trasferiti per definire misura di associazione tra i categoriali e i V. square e Cramer's V. E poi ci siamo trasferiti per definire misure di associazione per il numerical dati in cui abbiamo visto covarianza abbiamo anche esaminato il coefficiente di variazione nel riepilogare i dati e per quanto riguarda le misure di associazione abbiamo guardato alla covarianza e poi abbiamo guardato correlcoefficient.Così, con questo siamo arrivati alla fine del contenuto del corso per la portanza statistica di questo corso e poi nella lezione successiva inizieremo la probabilità.