Loading
Note di Apprendimento
Study Reminders
Support
Text Version

Set your study reminders

We will email you at these times to remind you to study.
  • Monday

    -

    7am

    +

    Tuesday

    -

    7am

    +

    Wednesday

    -

    7am

    +

    Thursday

    -

    7am

    +

    Friday

    -

    7am

    +

    Saturday

    -

    7am

    +

    Sunday

    -

    7am

    +

In questa lezione guardiamo i dati in poco più dettagli. Cerchiamo di scoprire quali tipi di dati esistono e poi cerchiamo di capire quando usiamo quali tipi di dati. Quindi, per intenderci, basta guardare una piccola foto in cui abbiamo un sacco di cose che sono scritte. E più tardi li classifichiamo o li portiamo in dati. Così, potresti trovare qualche nome qui potresti trovare qualche nome, come Akhil o Alipt o Nakul o Priya. Potresti trovare nomi che potremmo trovare anche cose come M F che tipo ci fanno capire che potrebbero rappresentare maschio e femmina. Quindi, trovate numeri come 98,26, 95,27 che potrebbero significare qualcosa che potrebbe significare dei segni medi. O forse, potrebbero significare una specie di rango o un percentile o qualcosa. E poi trovate alcuni numeri come 2, 3,2 e così via. Quindi ora, tutti questi sono dati e utilizzeremo questo come esempio per cercare di capire i vari tipi di dati. Così come varie categorie di dati. Quindi, da questo, possiamo capire i dati non solo numeri ma anche i nomi potrebbero rappresentare dati, anche i simboli potrebbero rappresentare dati. Ad esempio, M e F potrebbero rappresentare maschi e femmine che sono simboli o notazioni per rappresentare i dati mentre, abbiamo nomi come Meghna o Nakul. Questo è un pezzo di dati prelevato. E poi ora portiamo tutti questi dati in un tavolo. Ora diciamo di ordinare e categorizzare questi dati. Quindi, siamo in grado di fare questo siamo in grado di dire che ci sono 5 nomi in modo che questi nomi vengano scritti e potremmo associare un male-femmina con i nomi anche scritti. E poi guardiamo questo insieme di numeri che sono come 27, 25, 26. E poi beviamo la serie di numeri che sono 95,27 96,15 e così via, e poi guardiamo a 5, 2, 3, 0, 12 e così via. Se lo si guarda con molta attenzione questi 25 pezzi di dati potrebbero non esserci nel quadro precedente. Ma si potrebbe dire che questo tipo di tavolo può sempre essere tratto dalla fonte da cui erano stati presi i dati sul quadro precedente. Ora abbiamo classificato questi dati, lo guardiamo un po' di più e poi possiamo dare alcune rubriche generiche come indicato per la prima colonna che ha Meghna, Nakul, Priya. Ovviamente il secondo potrebbe essere il genere, e che potrebbe rappresentare maschio e femmina corrispondenti ai nomi che ci sono. Ora, uno guarda la terza colonna si può pensare a molte cose che la terza colonna potrebbe rappresentare. E forse, la terza colonna potrebbe rappresentare l'età di questa persona. Quindi, potrebbe rappresentare, l'età di questa persona ipotizzando che questi siano studenti di una classe, diciamo una classe MBA o qualunque. Così, questo potrebbe rappresentare l'età lì. Il quarto potrebbe rappresentare un punteggio. Ad esempio, potrebbero rappresentare un punteggio percentile in un esame di ingresso basato sul quale sono stati ammessi. E il quinto potrebbe rappresentare un'esperienza lavorativa. Anche se qualcosa come 12 per una persona di 22 anni è inconsistente. Rappresentano solo alcuni pezzi di dati che ci sono. I dati che abbiamo ora vengono inseriti in una tabella dati, con ogni colonna che ha una intestazione, e i dati si inseriscono in questa rubrica come il nome, il sesso, il punteggio dell'età e l'esperienza. Quindi, abbiamo anche bisogno di unità per alcuni di loro. Quindi, l'età sarebbe anni e l'esperienza potrebbe essere anni mentre gli altri potrebbero non avere un'unità esplicita in cui si misura. Il punteggio potrebbe essere misurato come un percentile, e il 12 mese è un outlier. I dati potrebbero avere degli outliers e dobbiamo raccogliere e compilare attentamente i dati. Quindi, uno dovrebbe anche essere in grado di comprendere gli outlier in dati che vengono mostrati dai 12 mesi. Ora, una volta che facciamo un tavolo come questo le colonne sono chiamate variabili, come il nome, il sesso, il punteggio dell'età e l'esperienza, e le righe sono chiamate casi o osservazioni. Si tratta di una terminologia generale che viene utilizzata, le colonne sono chiamate variabili le righe sono chiamate casi o osservazioni. Che tipo di dati sono questi? Ad esempio, le colonne 1 e 2 rappresentano dati che non sono numeri mentre, colonne 3, 4 e 5 rappresentano dati che sono numeri. A volte è anche usuale rappresentare, in questo caso, abbiamo M e F che rappresentano il gender. A volte potremmo usare una notazione diversa come un 1 e 0 e così via. Ma le colonne 1 e 2 generalmente non hanno numeri che rappresentano i dati; mentre, 3, 4 e 5 hanno numeri che rappresentano i dati. Come classifichiamo i tipi di dati? La prima classificazione si chiama dati categoriali e dati numerici. Se torniamo al primo, il tavolo i primi 2 sono categoriali e i successivi 3 sono numerici. Quindi, i dati categoriali sono risposte che appartengono a gruppi o categorie. A volte potrebbero essere un tipo di saggiamento. Potrebbero essere qualcosa come un fortemente accetta di essere fortemente in disaccordo e così via. I dati numerici utilizzano un valore numerico come risposta, potrebbe essere un numero discreto o potrebbe essere un numero continuo, ad esempio il numero di studenti in un'altezza di classe di persone in una località, e così via. La prima classificazione sono i dati categoriali e i dati numerici. Un'altra classificazione sono i dati qualitativi e i dati quantitativi. Quando si dice dati qualitativi non c'è un significato misurabile alla differenza dei numeri. Per esempio, il numero nella camicia di una persona sportiva. Potresti trovare un giocatore di cricket che indossa un numero 12, e un altro giocatore di cricket che indossa un numero 82. In realtà non significano molto per niente solo che descrivono qualcosa. Non si può distinguere, mentre aiuta a distinguere dicendo che se vedo il numero 12 so che questo è lo sportivo, e vedo il numero 82, vedo un'altra persona, ma non c'è modo di dire che la persona che indossa un 82 sia un giocatore senior rispetto alla persona che indossa il numero 12. I dati qualitativi sono ulteriormente suddivisi in 2 tipi che si chiamano dati nominali e dati ordinali. Abbiamo anche dati quantitativi dove possiamo dare qualche significato alla differenza. Per esempio, qualcuno ha segnato 80 marchi e l'altro ha segnato 60 marchi. Poi le istanze si possono dire che questa persona ha segnato più dell'altra, e in qualche altra ricorrenza si potrebbe dire ha segnato due volte il segno rispetto all'altro. All'interno del quantitativo, abbiamo intervallo e rapporto, all'interno dei qualitativi hanno nominale e ordinal.Quindi ci sono 4 ampie classificazioni o tipi di dati, dati nominali, dati ordinali, dati di intervallo e dati di rapporto. Categorico, nominale, no ordine implicito, ordine ordinale o classifica, dati numerici classificati all'intervallo in cui possiamo aggiungere e sottrarre, e rapporto dove possiamo anche moltiplicare e dividere in aggiunta per aggiungere e sottrarre. Il nome è un tipo di dati nominale. Nessun genere di ordine implicito è nominale. In questo caso, si dice maschio o femmina, dati qualitativi, l'età del rapporto è un rapporto. Quindi, si potrebbe dire che questa persona è due volte venduta come l'altra, è un tipo di rapporto di rapporto. Il percentile nell'esame di qualificazione è un tipo ordinale di dati, c'è un ordine o una classifica, si può dire che qualcuno che ha ottenuto il 98,26 avesse una classifica più alta di qualcuno che ha ottenuto un 97,44 allo stesso tempo non possiamo dire che questa persona ha segnato di più, non può dire che perché questi sono percentili, e questi rappresentano solo una classifica dei segni segnati. Non si può tornare indietro e dire, che la persona che ha ottenuto il 96,15 ha ottenuto un marchio in più rispetto alla persona che ha ottenuto il 95,27. Ma quello che rappresenta è questa persona che ha ottenuto il 96,15 è nella top 96,15% di chi ha scritto l'esame. Mentre quello che ha ottenuto il 95,27 è all'interno della top 95,27 di coloro che hanno scritto l'esame, quindi si tratta di dati ordinali. L'esperienza lavorativa può essere un dato di intervallo, si può tornare indietro e dire che la persona che ha 3 anni di esperienza lavorativa ha un solo anno di esperienza lavorativa rispetto alla persona che ne ha 2, ma non è molto giusto concludere che questa persona abbia una e mezza volta più esperienza di lavoro. Vediamo ora che abbiamo nominale, ordinale, intervallo e rapporto. Troviamo esempi di tutti i 4 tipi di dati, data una certa descrizione dei dati. È molto importante capire di quale categoria proviene. La maggior parte del tempo ha osservato che è solo quel poco difficile distinguere tra intervallo e rapporto. Ordinale è ragionevolmente tutto giusto perché si trova solo un rango nominale facile relativamente al tipo di identità. Mentre, spesso è difficile distinguere tra intervallo e rapporto. Quindi, uno deve solo capire questo punto con molta attenzione che un intervallo che diciamo aggiungere e sottrarre ha un rapporto di senso tutto il 4 ha senso. L'esempio in cui abbiamo detto intervallo è mentre diciamo che la persona con 3 anni di esperienza lavorativa ha un anno in più rispetto alla persona con il 2, è difficile dire che la persona abbia una e mezza volta l'esperienza o la conoscenza. Pertanto, le categorizziamo come intervalli. Quindi, è importante dare il tipo di dati per capire rapidamente che tipo di questi 4 si adatta, e che arriva per pratica costante e anche capendo il contesto in cui i dati sono stati prelevati o i dati vanno utilizzati. Ad esempio, se potessimo dare segni per l'esperienza lavorativa invece di usare anni, di nuovo si potrebbe solo guardarlo come un tipo di intervallo di dati. Un altro esempio potrebbe essere una specie di lavoro di classe per te. I seguenti dati sono stati raccolti a partire dal 100, i manager la fascia di stipendio di stipendio in senso dicono 10 mila a 20.000, 20,000to 50.000. Un modello di auto che hanno, l'anno di laurea anni di esperienza, più alto numero di aziende che hanno lavorato in che tipo di computer hanno a disposizione il marchio di paesi che hanno visitato se sposati o il numero di figli che poi hanno, e qual è il loro sport preferito. Quindi ora, ti rendi conto che ci sono 10 tipi diversi di dati, e potresti provare e classificare questi nei 4 tipi che abbiamo visto nominale, ordinale, intervallo e rapporto. E possiamo anche dare alcune unità numeriche per i dati numerici. Analogamente, se si guardano contesti come un'ammissione MBA o una clinica odontoiatrica o una cassa di risparmio o un rivenditore di automobili o un reparto acquisti e una fabbrica, scuola, supermercato, database di cricket, il profilo di facoltà di IIT madras, o un profilo di facoltà di qualsiasi istituto educativo, un museo. Quindi, qui prima di tutto si possono raccogliere circa 10 a 20 tipi di dati in questo. E poi classificarli in ordinale nominale, intervallo e rapporto.