Loading
Note di Apprendimento
Study Reminders
Support
Text Version

Descrivere i dati categoriali

Set your study reminders

We will email you at these times to remind you to study.
  • Monday

    -

    7am

    +

    Tuesday

    -

    7am

    +

    Wednesday

    -

    7am

    +

    Thursday

    -

    7am

    +

    Friday

    -

    7am

    +

    Saturday

    -

    7am

    +

    Sunday

    -

    7am

    +

In questa lezione continuiamo la discussione sui dati categoriali. Quindi, continuiamo con lo stesso esempio e che parla del numero di voti interpellati. Diciamo in un sito di cricket quando la domanda che segnerebbe la maggior parte delle esecuzioni è stata chiesta, diciamo che, questo sarebbe dati immaginari; poi la lista dei giocatori dati. E poi, questa tabella, che è la tabella di frequenza, ha ora 4 colonne. La prima colonna è il nome del giocatore, il secondo è il numero di voti interpellati, il terzo sarebbe la frazione di voti polling e la quarta è la frazione rappresentata come percentuale. E presumiamo che, questi sono gli unici giocatori considerati. Pertanto, le percentuali aggiungono fino al 100 e la frazione aggiunge fino al 1. Così, questa tabella sintetizza adeguatamente ciò che vogliamo vedere. Ma, dato che il numero di casi e osservazioni aumenta, si otterrebbe una sensazione che questo tavolo, sembrerebbe un po' cliclato e sembrerebbe forse un po' difficile da capire i dati. La prossima domanda che guardiamo è, possiamo rappresentarlo sotto forma di una foto chiamata grafico a barre che è un grafico a barre orizzontale, che mostra ora il numero di voti interpellati da giocatori diversi. Se guardiamo al bar più lungo, si può concludere che questo giocatore ha segnato il numero massimo e qualcosa tra 40000 e 50000 e forse più vicino a 48 o 49000. Anche se a questo punto è molto difficile, semplicemente guardando il bar per scoprire il numero effettivo che potremmo ricavare da questo tavolo che parlava del 48977. Nonostante ciò, il grafico a barre è un modo molto comodo per rappresentare i dati ed è ampiamente utilizzato come un modo per rappresentare dati categoriali, ora le stesse informazioni vengono mostrate in due diverse forme. Ora, quello che facciamo è, in entrambi questi, ora questo è il grafico a barre orizzontali, quello che qui viene mostrato è un grafico a barre verticale e quello che abbiamo cercato di fare qui è che, se osservi con attenzione, in questo grafico a barre verticali i giocatori sono già ordinati al più piccolo numero di voti interpellati al maggior numero di voti. E analogamente, c'è anche uno smistamento dal maggior numero di voti interpellati al più piccolo numero di voti interpellati in questo. Un tale grafico è chiamato grafico di Pareto. In un grafico di Pareto i bar sono disposti in modo che quello con la frequenza maggiore arrivi per primo, e progressivamente, si riduce alla frequenza più piccola. Quindi, entrambi sono grafici a barre. Allo stesso tempo, entrambi sono anche grafici di Pareto. Ora, guardiamo un'altra serie di dati per capire il bar charts.Now, diciamo che abbiamo raccolto dati per circa 13 anni sul numero di studenti ammessi a una classe MBA. E i dati mostrano che, nell'anno 1, sono stati ammessi 38 studenti; mentre nell'anno 13 sono stati ammessi 63 studenti. In questa tabella le variabili c'è la variabile che vogliamo guardare è il numero degli studenti. È anche un dato di serie temporale perché, mostriamo questo da anni 1 a 13 e poi questo quando rappresentato come grafico a barre, sembrerebbe questo; con i 13 anni che rappresentano le sbarre e il numero di studenti qui mostrato. Questo è un esempio di grafico a barre verticale e uno potrebbe vedere questo. Si può anche osservare da questo grafico a barre che, anno 12 aveva un numero massimo di studenti e abbastanza vicino a 10or molto vicino a 100. Si può vedere la stessa cosa qui perché year12 ha 99 studenti. Se possiamo disegnare questo grafico a barre e oggigiorno, possiamo disegnare questo grafico a barre molto comodamente utilizzando software disponibili sul computer con simpatiche codifiche di colori eccellenti e così via. Quindi, il grafico a barre sembra estremamente piacevole all'occhio e ci vuole anche pochissimo tempo per disegnare davvero questo grafico su un computer e presentarlo in qualsiasi presentazione formale. Molte volte, i grafici a barre sostituiscono la tabella e sono modi convenienti di presentare dati categoriali. I grafici a barre sono utilizzati per mostrare la frequenza della variabile categoriale che è il numero di studenti ammesso. Il prossimo grafico che vediamo si chiama grafico a torta; un grafico molto diffuso e molto usato che si chiama grafico a torta. E questo è un grafico a torta corrispondente ai nostri dati immaginari sui voti polling e così via. Ora, capiamo rapidamente dalla codifica colorata i diversi giocatori. Il grafico a torta mostra la distribuzione di una variabile categoriale come wedges di un cerchio. La cosa più importante da capire in un grafico a torta è che viene utilizzata per frazioni o proporzioni. I grafici a torta sono utili per le proporzioni in particolare quando queste proporzioni sono più vicine a metà, 1/4 e così via. I grafici a torta della ragione semplice sono utilizzati per le proporzioni dei grafici a barre sono effettivamente utilizzati per valori e numeri assoluti c'è una sensazione generale lì che, in realtà è più facile confrontare le barre che confrontare le aree. Ad esempio, se guardiamo a questo bar è abbastanza facile e veloce dire che questo bar è molto più alto rispetto al resto dei bar. E quindi, questo è quello che ha la frequenza più alta. Ora, guardiamo l'anno 8 e l'anno 10.If si guarda ai dati reali, anno 8 ha 69, anno 10 è 68. E i bar, se li guardi con attenzione e li guardiamo molto da vicino, è possibile capire che anche se entrambi sono ugualmente alti, uno può guardare con attenzione questo e capire che l'anno 8 è leggermente più alto dell'anno 10; mentre, se questi fossero rappresentati nella torta, sarebbe estremamente difficile dire quale area è in realtà più grande dell'altra se si guarda questa torta. Ad esempio, è molto difficile dire se si tratta di una zona più grande o se si tratta di un'area più ampia. Quindi, questa è la limitazione generale del grafico a torta rispetto al grafico a barre, ma è stato detto che i grafici a torta sono ottimi; in particolare quando si ha un numero minore di wedges rappresentato da questa frase. E le zone sono più vicine a metà, 1/4 e c'è una differenza percepibile nelle zone. Osservando solo la torta, dovremmo essere in grado di dire che questo è più grande dell'altro. E se abbiamo quel tipo di situazione, si utilizzano grafici a torta ed è molto importante notare che i grafici a torta sono utilizzati per le proporzioni. È anche importante notare che, è più facile confrontare le barre che confrontare le aree. E quindi, ovunque i grafici di barre pertinenti devono essere utilizzati in anticipo rispetto ai grafici a torta, anche se a volte i grafici a torta sono più attraenti per l'occhio rispetto ai grafici a barre. Torniamo a questo esempio del numero di facoltà. Quindi, analizziamo un reparto MBA di un college e poi questo dipartimento MBA ha raggruppato la facoltà che hanno in gruppi. Questi gruppi sono chiamati il gruppo delle operazioni, il gruppo di finanza, il gruppo di gestione delle risorse umane, il gruppo di marketing e così via. Ora abbiamo circa 24 persone 6 più 5 1115 18 20 20 4 persone e questo è il raggruppamento. Ecco, questa è la tabella di frequenza che parla del numero di persone in ogni gruppo. Ora, se disegniamo un grafico a barre, un grafico a barre orizzontali, uno otterrebbe un grafico a barre come questo. Il grafico a barre racconterebbe che ci sono 6 persone nel gruppo delle operazioni. Mentre c'è una persona nel gruppo dei diritti di proprietà intellettuale e così via. Ora, cerchiamo di rappresentare la stessa cosa sotto forma di grafico a torta. Questo grafico a torta viene mostrato qui e insieme alla codifica a colori, si può capire rapidamente che 6 persone date qui nel gruppo delle operazioni sono il gruppo più grande e poi si ottiene il gruppo successivo e così via. Questa è una buona rappresentazione in un grafico a torta, ma con una piccola questione, nel senso che, da questo si può ora se si guarda con attenzione a questo grafico a torta, ora vediamo che ci sono 7 colori diversi e sette wedges e si fissa in alcuni di loro sono vicini a 1 da 4.It è anche possibile capire che questo è più grande di questo che a sua volta è leggermente più grande di questo e così via. Ma quando lo rappresentiamo sotto forma di piechart, rappresentiamo proporzioni. Quindi, stiamo cercando di dire che a circa 25% ci sono 24 persone. Circa 25% appartengono a questo gruppo. Circa 5 entro il 24, che è quasi di circa 20% appartengono al gruppo successivo e così via. I numeri assoluti non arrivano in questo grafico a torta. Mentre il grafico a barre ci racconta tutto quello che il grafico a barre non ci dà la percentuale, ma il grafico a barre dà il numero reale di persone che si trovano in vari gruppi. Così, abbiamo visto 2 tipi di rappresentazione per questo e poi ci poniamo questa domanda che è migliore, un grafico a barre o un grafico a torta. E al momento, la risposta per questo è, il grafico a barre è una rappresentazione migliore. Se vogliamo rappresentare che ci sono 6 persone in questo gruppo su 24 persone, allora il grafico a barre è la rappresentazione. Se volete dire che il 25% delle persone appartiene a un determinato gruppo, allora il grafico a torta è la rappresentazione e tra i 2, in questo esempio bar è una rappresentazione migliore del grafico a torta. Questo è qualcosa che dobbiamo imparare e noi quando iniziamo a fare questo genere di cose e iniziamo a rappresentare diversi tipi di dati, allora sapremo esattamente quale sia un modo migliore per rappresentarlo e dobbiamo tenere a mente alcune cose che sono dei grafici a torta sono utilizzate per le frazioni e le proporzioni dei grafici a barre vengono utilizzate per i numeri reali. È sempre più facile capire dai bar per scoprire quale sia più grande piuttosto che dalle zone e 3rd; in particolare, quando il numero di cunei è piccolo e questi wedges sono distinti e vicini a dire 20% 25%, poi il grafico a torta diventa un significato pieno. Quindi, dobbiamo capire queste 3 cose e poi cercare di elaborare diverse situazioni per concludere finalmente se usiamo un grafico a barre o se usiamo un grafico a torta. La cosa più importante è che, quando vogliamo rappresentare frazioni o proporzioni, usiamo la torta e quando vogliamo rappresentare i numeri, usiamo bar. Chiediamo 20 studenti lì. Ora, l'esercizio è, dovrei disegnare un grafico a barre o devo disegnare un grafico a torta in questo. Chiedi a 20 studenti, la loro lingua madre interpreta un grafico a barre e un grafico a torta. Quindi, possiamo farlo. Potremmo disegnare un grafico a barre; potremmo disegnare un grafico a torta. E in questo caso un grafico a barre sarebbe preferito a un grafico a torta e lasciarci generalizzare dicendo che, tante percentuali di persone appartengono a una certa lingua madre, ma ci limitiamo ai 20 students.Poi, il grafico a barre è una rappresentazione migliore rispetto ai pacchetti pay grafico a torta dato a 50students sono disponibili. Interpreta un grafico a barre e un grafico a torta. Direi che il grafico a barre è un esempio migliore; tuttavia, se questi 50 andranno a rappresentare un campione generico da una popolazione numerosa e così via. E se in genere vogliamo concludere da questo dire che, il 10% di loro starebbe avendo un pacchetto retribuito di oltre 20 lattine e così via, allora si può usare una torta. Altrimenti, si userebbe un colore grafico a barre indossato da 50 studenti è disponibile ancora una volta grafico a barre a meno che non vogliamo generalizzare specializzazioni scattate dalla classifica dei bar degli studenti MBA, ma poi guarderemmo un grafico a torta solo se vogliamo generalizzare. E infine, diciamo che fuori dagli studenti MBA 20 si prenda questa specializzazione, 15 la presa di un'altra specializzazione, e così via. Il numero di studenti che iniziano le proprie aziende negli ultimi 10 anni è chiaramente un grafico a barre è un dato di serie temporale. Quindi, usiamo un grafico a barre in questo. Si tratta di un'idea molto semplice chiamata principio di area che è importante in un grafico a barre. Ogni volta che disegniamo un grafico a barre, dobbiamo osservare due cose. Innanzitutto, se si guarda questo grafico a barre verticale e guarda questo grafico a barre orizzontali, osserverete che tutte le barre dello stesso colore. Quindi, in questo caso, non abbiamo mostrato il bar corrispondente a giocatori diversi usando colori diversi e questo bar orizzontale ci dice anche che, mentre ci sono più bar rispetto al numero di giocatori e alcuni nomi dei giocatori non sono scritti qui, ma questo è bene per la discussione. Usiamo lo stesso colore perché; la variabile rappresentata è la stessa. Quindi, a meno che non rappresentiamo variabili diverse nello stesso grafico a barre, non usiamo colori diversi. A volte, quando pensiamo quando presentiamo i dati usando colori diversi, darebbe in realtà un aspetto più piacevole all'occhio. Ma, ciò che è importante da capire è che, finché rappresentiamo la stessa variabile, è importante usare lo stesso colore. Questo è il primo principio. Poi arriva il principio dell'area. L'area principal parla della larghezza del bar essendo uguale in tutte le barre. Ora, il principio dell'area era tanto più importante; quando abbiamo creato questi bar a mano usando una matita o usando un righello e così via. In tal caso quando lo abbiamo fatto a mano, dobbiamo garantire che lo spessore delle barre sia effettivamente lo stesso mentre la lunghezza delle barre è diversa e corrisponde alla variabile che si sta misurando. Oggi con l'uso crescente del software e l'uso crescente dei computer per farlo. Il principio dell'area è in realtà inteso come è fatto. Ma poi, all'utente, è importante capire il principio dell'area che parla della larghezza dei bar che sono gli stessi. Quindi, che l'area generalmente rappresenta quella che è la variabile che si sta misurando in qualche modo, la zona qui sarebbe paragonabile all'area nel grafico a torta quando facciamo quando presentiamo gli stessi dati usando una torta. È importante anche questa spaziatura tra le sbarre lo stesso. Questo è gradito all'occhio, ma ciò che conta è l'area occupata dalla parte del grafico dovrebbe corrispondere alla quantità di dati che rappresenta, il che significa che la larghezza dei bar deve essere la stessa. Ora, questo è un grafico a barre verticali, si tratta di un grafico a barre orizzontali. Spesso abbiamo anche questa domanda; dovrei rappresentare qualcosa come grafico a barre orizzontali o dovrei rappresentarlo come grafico a barre verticali. Ci sono solo due questioni e vi spieghiamo usando lo stesso bar. Quando lo si rappresenta come grafico a barre verticali diventa estremamente difficile scrivere il nome in modo orizzontale che è comodo all'occhio e qui finiamo per scrivere il nome in direzione y o in direzione verticale, e la lettura diventa un po' difficile. Quindi, questo è il primo svantaggio quando lo facciamo. Altrimenti bisogna mettere 1 2 3 4 e poi dare una leggenda qui dicendo che il 1 rappresenta altro. In questo modo, orizzontale ci dà un modo molto confortante per rappresentarlo qui. La cosa più importante è che; è possibile capire rapidamente la differenza in un grafico a barre orizzontale che in un grafico a barre verticali. Ad esempio, se vediamo questi 2 nomi, si può vedere una leggera differenza, ma poi uno deve avvicinarsi al bar per arrivare velocemente e vedere quale è più alto; mentre, diciamo, sono rappresentati qui come questi 2 bar, poi ci rendiamo conto velocemente che questo bar è più lungo. Quindi, ovunque possibile una barra orizzontale è una rappresentazione più comoda di una barra verticale per due motivi. Una è la capacità di scrivere il nome in modo semplice; è facile da leggere, ma la ragione più importante è la capacità dell'occhio di capire rapidamente quale sia più o più grande. Quando lo disegniamo in orizzontale piuttosto che farlo in verticale, l'altra cosa che dobbiamo capire è l'asse y e lo scaling in particolare quando trattiamo i dati. Supporre guardiamo, diciamo, questi numeri rappresentano la domanda di un determinato articolo in circa 8 mesi. Così, abbiamo mostrato in realtà 2 grafici dove abbiamo tracciato questo e entrambi questi sono gli stessi dati. Non sono diversi anche se le forme delle curve sembrano diverse. Entrambi sono in realtà gli stessi dati. Il motivo è che bisogna guardare con attenzione all'asse y. Nella prima parte, l'asse y è compreso tra 5800 e 6700. E ora, siamo in grado di vedere la diffusione o la dispersione nei dati comodamente e chiaramente qui mentre, gli stessi dati presentati, ma con asse y tra il 0 e il 8000. Ora ci rendiamo conto che non siamo in grado di capire quella dispersione in questo. Quindi, uno anche non solo prima di formarci un'impressione dal quadro, in particolare un grafico è molto importante capire e guardare l'asse y e poi formare un'impressione del quadro. In particolare, quando cerchiamo di capire dal solo grafico e non analizzando i dati di base da cui è stato effettivamente tratto il grafico. Ecco, questo è un altro aspetto quando si tratta di presentare i dati. Ora, guardiamo allo stesso esempio. Ci sono molteplici modi di presentarlo. Questo particolare grafico a torta che abbiamo già visto. Quindi, suppliamo, useremo una piechart per rappresentare questi dati. Anche se avevo detto che il bar sarebbe stato più significativo di una torta, userò questo esempio per mostrare diversi tipi di grafici a torta, altri due esempi di grafici a torta qui. In primo luogo, analizzeremo questo grafico a torta. Questo è anche un modo molto comune di rappresentare con sempre maggiore utilizzo di software e computer, ci sono momenti in cui osserviamo le persone presentano gli stessi dati in questo modo come la torta viene spezzata e la torta fa parte di un disco e così via che ha anche un piccolo effetto 3 - dimensionale in questo. E ora, vi renderete subito conto che questo è in realtà lo stesso che sta arrivando qui. Ora, questo è nella mia impressione, questo è un po' più difficile da comprendere rispetto a questo. Per il semplice motivo, che quando analizziamo questo aspetto, sono molto chiaro che un quarto di questo cerchio è effettivamente occupato da questo mentre quando rappresento gli stessi dati in questo modo, trovo molto difficile capire rapidamente che questo è in realtà un quarto di esso. Quando guardo questo e quando guardo l'altro, ora in questo grafico a torta circolare, so che l'area occupata da questa porzione è in realtà inferiore all'area occupata da questa porzione. Ma, quando inizio a presentare gli stessi dati in questa forma, sono leggermente confuso qui perché entrambi si assomigliano. Quindi, uno deve essere molto attento quando presentiamo questo tipo di grafico a torta. In particolare, quando 2 o 3 aree sono uguali e leggermente diverse a parità, allora diventa difficile distinguersi. A volte abbiamo visto persone rappresentate in questo modo. Gli stessi dati vengono presentati qui tranne che, vi renderete conto che gli ultimi 3 sono combinati in una piccola torta o un wedge qui che si allarga ulteriormente a questo a volte quando vogliamo raggruppare i dati, aggregare i dati per far sembrare bello il pasticcio. Ora, potete vedere che questa torta sembra molto bella rispetto a questa torta. Ci siamo anche resi conto che lo stesso 25% è in realtà qui, qui lo stesso 25% che era qui è in realtà qui. E ora, si vedono gli ultimi 3 più semplici quelli più piccoli sono ora, aggregati in uno che viene ulteriormente ampliato e mostrato che all'interno degli ultimi 6, 50% è qui gli altri sono qui. Si tratta di modi diversi di rappresentare il grafico a torta. Guardiamo ad alcuni altri esempi di colori delle auto parcheggiate in un'area di parcheggio molto simile. Si vede che si tratta di un particolare grafico a torta e qui si può vedere che, è espanso e viene mostrato qui. Ora, include gli altri. C'è una categoria chiamata altri. Qui in questa torta, la categoria chiamata altri viene rimossa; le altre vengono mostrate separatamente, e così via.