Loading

Alison's New App is now available on iOS and Android! Download Now

Study Reminders
Support
Text Version

Set your study reminders

We will email you at these times to remind you to study.
  • Monday

    -

    7am

    +

    Tuesday

    -

    7am

    +

    Wednesday

    -

    7am

    +

    Thursday

    -

    7am

    +

    Friday

    -

    7am

    +

    Saturday

    -

    7am

    +

    Sunday

    -

    7am

    +

Opzioni di personalizzazione di base

00.00 Speaker 1: Ciao a tutti e benvenuti nella parte 2 della sezione 3 della nostra Data Visualization con Python e Matplotlib serie tutorial. In questa parte, quello di cui parleremo in questa sezione sono tante le opzioni di personalizzazione che possiamo fare con Matplotlib. Ma prima dobbiamo avere un dataset decente. Così potremmo passare e potremmo creare manualmente questo dataset. Sarebbe un po' sciocco, soprattutto quando ci sono un sacco di datasets che possiamo ottenere su internet. Quindi il tipo di dataset che vorrei che utilizzassimo sono le scorte. Quindi con i dati azionari rappresenta un dataset didattico piuttosto buono per ben pochi motivi in realtà. Prima di tutto, i dati azionari tendono a venire con più serie. Quindi quello che intendo dire con questo è che ha più tipi di dati, quindi molte volte riceverai l'asse x saranno date, quindi questo è un aspetto interessante, ma anche tu avrai dei dati di prezzo, e a volte i dati di determinazione dei prezzi saranno di offerta / chiedi se stai pagando un sacco di soldi per i tuoi dati, oppure puoi ottenere dati aperti - high - high - low - low, e quindi ecco automaticamente quattro righe. Parleremo di quello che aprirà ad alta quota quando ci arriveremo.

01.12 S1: E poi anche voi potreste ottenere dati di volume che sono quante aziende sono state scambiate in quel periodo di tempo o quante azioni di quell' azienda sono state scambiate in quel periodo di tempo. Quindi con quello, è un altro dataset. E il volume è una scala completamente diversa dal prezzo, quindi ci permette di coprire un sacco di personalizzazione, in più possiamo anche fare vari tipi di trasformazioni sui dati. Così possiamo applicare le medie mobili, o qualunque cosa, e trame anche quelle. Così ci permette di lavorare con un sacco di variazioni di datasets. E poi anche, come dicevo prima, perché è una serie temporale, stiamo lavorando con date e cose del genere, così complottizzano date, le date non sono numeri, quindi il tuo grafico non capisce automaticamente che data. Quindi quello che dobbiamo fare è di solito convertire i dati che abbiamo in qualche formato di data accettabile dal nostro modulo.

02.03 S1: Così Matplotlib ha le sue piccole date mpl che piace. E per esempio, un altro modulo di charting che potreste ritrovarvi utilizzando la strada, forse, sarebbe come una sorta di modulo di tracciamento JavaScript. Quindi quello che mi viene in mente sarebbe qualcosa come Highgrafici, che prende i dati in forma di Unix times 1000, questo è come il tempo JavaScript. Quindi è necessario essere in grado di essere confortevoli con la conversione dei francobolli in Unix e Unix fino ad date stampe, e tutti i tipi di formati del genere. Quindi lavorare con i dati azionari è solo molto utile, ecco cosa andremo avanti e fare. Così prima faremo il nostro proverbio "cancellare tutto", tranne che per matplotlib.pyplot. E a quanto pare ho perso il mouse. Eccome ci sono. E così, cancelleremo tutto fino a questo punto, e ora faremo, andremo avanti e importeremo un'altra cosa da Matplotlib, quindi importare matplotlib.date come mdate. Di nuovo, la maggior parte delle persone che usano matplotlib.date lo accorciano fino a mdate, quindi continueremo a seguire quella standard.

03.06 S1: Poi siamo anche ... Possiamo o non potremmo toccare le date Matplotlib in questo specifico tutorial in questo momento, ma sarà utilizzato in questa sezione. Accanto andremo avanti e importa l'url lib perché accederemo ad internet. E poi imporremo NumPy come NP, perché useremo NumPy per fare alcuni dei nostri crunching di base e roba del genere. Così come dicevo prima, NumPy diventa abbastanza integrale, abbastanza veloce, ogni volta che si lavora con i dati dei numeri. Quindi se non hai NumPy, di nuovo, fai pip install NumPy, nessun problema.

03.40 S1: Così prima cosa vogliamo andare avanti e fare è che abbiamo bisogno di una sorta di funzione che afferra i dati, e andremo avanti e useremo le API di Yahoo Finance. Se non hai familiarita ' che sta benissimo. Non c'è autorizzazione o autenticazione che vada lì. Sono informazioni gratuite, quindi non serve avere un account con Yahoo o niente del genere. Per cominciare, andremo avanti e ci definiremo, e chiameremo questo 'graf_data,' e poi avremo un parametro che passiamo, e questo sarà azionario. Quindi quello che sarà è qualunque stock che passiamo come quel parametro, ecco cosa verrà tirato e grafato. Quindi per aiutarci a sapere quale azienda stiamo facendo, andremo avanti e stampiamo quell' azienda, quindi ci stamperemo, e faremo 'attualmente tirando', poi faremo, virgola, stock. Quindi per dire basta, attualmente tirando, e poi faremo un colon lì e stamperemo il ticker che stiamo tirando. Quindi se non hai familiita ' ... Le scorte sono identificate dai loro ciclisti. Così ad esempio Apple, l'azienda che vende telefoni e computer e roba, il loro ticker ... Il loro nome è A - P - P - L - E, Apple Incorporated e poi hai il loro ticker è AAPL. O come un altro sarebbe come Tesla con le loro auto elettriche, sono TSLA, quindi solo capirlo. Puoi sempre andare su Google e digitare il nome dell'azienda e puoi scoprire il ticker se non lo sai già.

05.05 S1: Quindi, comunque, ci tireremo e ora scriveremo l'URL. Quindi questo sarà l'URL che ... E chiameremo questo URL uguale ... E questo sarà l'URL per quel ticker specifico dalla API di Yahoo Finance. Così mettiamo questo in una stringa, e sarà 'http: // api.finance.yahoo.com/instrument/1.0/ + + ' e poi questo qui dentro sarà lo stock, quindi questo è in realtà il ticker. Quindi attualmente tirando, questo sarà il ticker, questo è il ticker per quello stock, questo è il ticker. Quindi questo potrebbe essere in teoria "AAPL/chartdata; preventivo" perché è un preventivo di prezzo e poi possiamo specificare la gamma qui. Quindi la gamma sarà uguale a quello che vogliamo e faremo solo 10 anni per ora. Giochiamo con intervalli come andiamo avanti. Le API di Yahoo Finance commutano le loro rappresentazioni di data.

06.25 S1: Quindi se si fa davvero a breve termine come un giorno o tre giorni, otterrete dei francobolli orari che sono di tempo UNIX. E se fai più time frames, penso che qualsiasi cosa dopo tipo 10 giorni, sarà tuo ... 10 giorni e più, sarà rappresentato in like date francobolli che puoi guardare e li leggeresti. Quindi, comunque, ci occupiamo di entrambi o di accordo con entrambi così sapresti come gestirli. Ma per ora inizieremo con 10 anni e poi faremo solo /CSV e chiuderemo la nostra citazione lì. Quindi, in teoria, andiamo avanti e stamperemo solo l'URL. Ok, quindi scenderemo qui e poi, diremo come stock qui uguale e poi diremo input e poi stock come questo 'stock2plot:' Aggiungi uno spazio perché altrimenti se digita ti piacerà tipo proprio sopra.

07.19 S1: Così stock2plot, quindi questo permetterà all'utente di tipo di tipo qualcosa in. Quindi l'input ci permette solo di scrivere nella console praticamente. E poi andremo avanti e correremo i dati di graf_data per qualunque cosa sia quella stock. Quindi diremo solo stock. Passiamo in stock qui che si chiama anche stock, stock e costruisce questo URL almeno. E poi stampiamo solo l'URL e poi lo visiteremo manualmente per guardarlo. Quindi, andiamo avanti e salviamo e corri. Così, su questo dovrebbe far pop il tuo console qui. Lasciatemi trascinare sopra. Non sembra di toccarlo in questo momento. Quindi spostalo qui e diciamo che vogliamo fare TESLA. Quindi questo sarebbe l'URL che ci alimenta. Quindi copiano quell' URL e apriamo tutto in un browser. Così, quando lo visitiamo in un browser, questo è quello che otteniamo. E'un piccolo piccolo prezzo quindi fatemi solo zoomare un po' per voi ragazzi. E così questi sono i dati. Così è stato con il CSV di 10 anno. E così potete vedere qui che ci sono alcune informazioni iniziali qui che ci sono praticamente inutili. Ma poi se ci scorriamo un po' giù, questo inizia a sembrare dei dati abbastanza normalizzati. Così, possiamo guardare questo visore e prendere un gander in quello che è.

[ zuckle]

08.33 S1: Così vediamo. Andremo a qui. Quindi hai lasciato dire questa linea qui. Questo è il timbro della data e possiamo ordinare di degustare. Potrebbe essere un po' difficile vedere visivamente ma sappiamo che questo è l'anno. Quindi, 2011, il mese, quindi 10 così ottobre e poi il giorno, quindi la 3a. Così il 3 ottobre 2011 e poi abbiamo le informazioni sui prezzi. E ordinano una sorta di funky. Fanno chiudere - alto - basso - aperto. E poi finalmente il ... Quindi questo è vicino, questo è l'alto per l'intera giornata, questo è il basso per l'intera giornata, e questo è l'aperto. Quindi, quando i prezzi di quel giorno si sono aperti, al mercato aperto, qual era il prezzo dell'azienda? Era il 24,95. Per quell' intera giornata, qual era il prezzo più alto? 27,6 e poi hai qualche altra informazione lì. E poi questo è il volume così è quante condivisioni di quell' azienda sono state scambiate. In realtà è un bel po' di volatilità dal 22 al 27. Come, oh, il mio gosh. [ chuckle] Che era ... Questo è un stock abbastanza volatile come suppongo inizialmente. Oh, la mia bontà. Avevano abbastanza pochi ... Come questi intervalli sono massicci per le scorte di comp. Come di solito si hanno come 1% in un giorno come i più. Comunque, questo è il nostro dato e continueremo a lavorare con questo nelle prossime esercitazioni parleremo come analizzare tutto questo dato e assegnarlo alle variabili, e poi presto la riterremo e tutto questo. Quindi, restate sintonizzati per questo.
00.00 Speaker 1: Ciao a tutti, e benvenuti nella quarta parte della Sezione Tre, che è la visualizzazione dei dati in Python con matplotlib. In questa parte, quello di cui parleremo è creare questa funzione di conversione per le nostre informazioni sui dati che stiamo tirando offline. Così come dicevo a volte la conversione dei dati di data in modo da poterla tracciare in un grafico può essere confusa ma una volta che ci si abitua alla gestione per i dati della data non diventa più così noioso. Quindi, comunque, nella conversione abbiamo specificato una funzione di conversione ma in realtà non abbiamo quella funzione. Quindi andiamo avanti e costruiamo quella funzione ora. Quindi facciamo solo una nuova funzione qui e la chiameremo la stessa cosa ovviamente, quindi byte pdate2num e poi questa funzione prende un formato e poi ci vuole la codifica. E la codifica sarà TF8 perché quella è la codifica dei dati internet.

00.56 S1: Quindi: quello che faremo ora è che cominceremo con un string_converter e il convertitore di stringa è l'equivalente di M date che normalmente è così che funzionava ed era fantastico ma non funziona ancora completamente in tre così uguale M dates.strpdate2num, quindi strip data al numero e poi formato, fmt. Quindi in passato si era abituati a dire che il tuo convertitore era sostanzialmente uguale a questo, giusto? Come questo. Così potremmo copiare questo e incollare. E quella base ... Quello usato per lavorare in Python 2 ma non funzionerà in tre a causa di questa roba informativa sui byte. Quindi, il convertitore di stringa è uguale a quello ma poi dobbiamo fare qualche altra cosa. Quindi facciamo un ... Creeremo questa piccola funzione di prova e si chiamerà convertitore di byte e poi passeremo in B qui e poi diremo S=b.decode utilizzando il formato di codifica lì. Quindi, stiamo decodificando UTF8 poi torneremo il str_convertitore S poi restituiamo il bytes_ ... O byte, non abbiamo messo sottopunteggio. Aggiungete un underscore qui. Quindi, sottolineatura e sottolineatura.

02.34 S1: Quindi questo dovrebbe convertire i dati nel formato che vogliamo che sia in formato date M. Così scendiamo qui e andiamo avanti e solo data di stampa. Quindi dopo questa lunga linea qui, stampiamo la data e vediamo se ha funzionato davvero come volevamo. Quindi salveremo e correremo in modo veloce. Continueremo su con TSLA. Ok, di sicuro abbiamo tracciato queste date M. Ok, quindi queste sono le tue date e tutto è fantastico. Quindi, anche se ... Già, di nuovo queste date non significano niente probabilmente per te ma significa molto per matplotlib. Ecco allora i numeri che vogliamo vedere, qualcosa negli anni 700.000s per ora. Così vicino che. Figo. Quindi la nostra conversione ha funzionato anche se potrebbe non sembrare la migliore ma ora siamo pronti a tracciare alcune informazioni. Quindi quello che possiamo fare ora è invece di data lì, lo elimineremo. E poi ora, possiamo fare plt.plot_date, quindi notiamo matplotlib che stiamo per passare delle date. La data e poi la stretta P, poi faremo un pl.show vero veloce. Plt.show.

03.47 S1: Ora con matplotlib, quando facciamo una data di trama non incontriamo la trama della linea. Inadempie a una trama sparsa quindi lascia che ti mostri, non una spaccata, per default è solo un marker di puntino, anche se quindi se facciamo di nuovo TSLA, la classifica che verrà qui. Giusto, quindi vedi i piccoli marcatori sono questi piccoli puntini? Ok, quindi possiamo gestire per quello chiudendoci qui e aggiungere un altro argomento qui e questo è solo il tipo di linea, quindi basta fare un trattino, giusto? Quindi il trattino è due chiavi rispetto alla tua chiave di backspace. Ora eseguiamo quella un'altra volta. Oh, ero come " Dov' è la classifica? Non sta scoppiando ". TSLA e ora in realtà abbiamo un grafico di linea. Ora, fatemi rendere un po' più grande qui. Così possiamo vedere che abbiamo luglio, Jan; sostanzialmente Jan e luglio fino in fondo ma cosa succede, ciò che è bello della data formatting è proprio ora che potete vedere che è solo il mese e l'anno, e davvero non molti mesi, sono solo Jan e luglio, e luglio è solo a metà strada. Quindi davvero questi sono solo ogni sei mesi che ci mettiamo un marcatore lì.

04.55 S1: Ma se ingrandiamo in un punto specifico, vedrete che, "Oh, ci arriviamo più mesi". Giusto? Abbiamo febbraio e aprile ma quando possiamo zoomare di più, e ora abbiamo più giorni all'interno di febbraio. E potremmo continuare a zoomare dentro e potete vedere ora abbiamo sei, sette, otto, nove, 10, 11, 12 e non abbiamo qui dati di granularità davvero elevati. Ma in realtà potremmo continuare a zoomare dentro e ora potete vedere questi sono timbri in quella data, ok? Quindi, non abbiamo dati per quel tempo ma possiamo in teoria continuare a zoomare e ottenere davvero, davvero, davvero molto vicino. [ chuckle] Comunque, ok, così ha funzionato. Così ora abbiamo il nostro set di dati, abbiamo un grafico davvero semplice. Non abbiamo i nostri titoli e le nostre etichette e tutte quelle cose ancora. Ma quello che faremo in questa serie è personalizzare questo grafico per includere tutti i tipi di personalizzazioni fantastiche, colori, opzioni e tutta questa roba buona. Quindi, questo dovrebbe essere piuttosto entusiasmante e fortunatamente non faremo davvero troppa riscrittura di codice, ci aggiungiamo solo sopra di praticamente questo grafico. Quindi non tanto di quel proverbiale cancelletto questa volta. Quindi in ogni caso, bella serie o sezione che arriva presto la tua strada. Quindi, restate sintonizzati per questo e grazie per aver guardato.