Loading

Alison's New App is now available on iOS and Android! Download Now

Study Reminders
Support
Text Version

Set your study reminders

We will email you at these times to remind you to study.
  • Monday

    -

    7am

    +

    Tuesday

    -

    7am

    +

    Wednesday

    -

    7am

    +

    Thursday

    -

    7am

    +

    Friday

    -

    7am

    +

    Saturday

    -

    7am

    +

    Sunday

    -

    7am

    +

Options de personnalisation de base

00:00 Président 1: Bonjour, tout le monde, et bienvenue à la partie 2 de la section 3 de notre Visualisation des données avec les séries de tutoriels Python et Matplotlib. Dans cette partie, ce dont nous allons parler dans cette section sont beaucoup des options de personnalisation que nous pouvons faire avec Matplotlib. Mais nous devons d'abord disposer d'un ensemble de données décentes. Nous pourrions donc passer et nous pourrions créer manuellement ce jeu de données. Ce serait un peu ridicule, surtout quand il y a plein de jeux de données que nous pouvons obtenir sur Internet. Donc le type de jeu de données que j'aimerais que nous utilisions est des stocks. Donc, avec des données de stock, il représente un bon jeu de données du tutoriel pour très peu de raisons en fait. Tout d'abord, les données sur les stocks ont tendance à être de multiples séries. Donc ce que je veux dire par là c'est qu'il a plusieurs types de données, donc beaucoup de fois vous obtiendrez l'axe des x sera des dates, donc c'est un aspect intéressant, mais aussi vous aurez des données de prix, et parfois les données de prix seront des soumissions / demandez si vous payez beaucoup d'argent pour vos données de toute façon, ou vous pouvez obtenir des données open-high-low-close, et donc c'est automatiquement quatre lignes. Nous parlerons de ce qui est ouvert-très bas-lorsque nous y serons.

01:12 S1: Et vous pouvez aussi obtenir des données de volume, c'est-à-dire combien de sociétés ont été échangées pendant cette période ou combien d'actions de cette société ont été échangées durant cette période. Donc avec ça, c'est un autre jeu de données. Et le volume est une échelle complètement différente de celle du prix, donc il nous permet de couvrir une grande partie de la personnalisation, plus nous pouvons aussi faire divers types de transformations sur les données. Nous pouvons donc appliquer des moyennes mobiles, ou autre, et les représenter aussi. Il nous permet donc de travailler avec beaucoup de variations de jeux de données. Et puis aussi, comme je le disais auparavant, parce que c'est une série temporelle, nous travaillons avec des dates et des trucs comme ça, donc les dates de traçage, les dates ne sont pas des nombres, donc votre graphe ne comprend pas automatiquement quelle date elle. Donc ce que nous devons faire, c'est que nous devons généralement convertir les données que nous avons en une sorte de format de date qui est acceptable par notre module.

02:03 S1: Matplotlib a ses propres petites dates de mpl qu'il aime. Et par exemple, un autre module de cartographie que vous pourriez vous trouver à l'aide de la route, peut-être, serait comme une sorte de module de traçage JavaScript. Donc celui qui vient à mon esprit serait quelque chose comme Highcharts, qui prend des données sous la forme d'Unix fois 1000, c'est comme le temps JavaScript. Donc vous devez être en mesure d'être à l'aise avec la conversion de timbres de date en timbres Unix et Unix jusqu'à ce jour, et toutes sortes de formats comme ça. Donc, travailler avec les données sur les stocks est très utile, donc c'est ce que nous allons faire. Donc d'abord nous allons faire notre proverbial "supprimer tout", sauf pour matplotlib.pyplot. Et apparemment j'ai perdu ma souris. C'est là. Et donc, nous supprimerons tout jusqu'à ce point, et maintenant nous allons faire, nous allons continuer et importer une chose de plus de Matplotlib, donc importer matplotlib.dates comme mdates. Encore une fois, la plupart des gens qui utilisent matplotlib.dates le shorthand à mdates, donc nous allons continuer à suivre cette norme.

03:06 S1: Alors on est aussi ... Nous pouvons ou non toucher Matplotlib dates dans ce tutoriel spécifique en ce moment, mais il sera utilisé dans cette section. Ensuite, nous allons aller de l'avant et importer l'url lib parce que nous allons accéder à Internet. Et puis on va importer NumPy comme NP, parce que nous allons utiliser NumPy pour faire une partie de notre crunching de base et des trucs comme ça. Comme je le disais auparavant, NumPy fait partie intégrante, assez rapide, à chaque fois que vous travaillez avec des données de nombres. Donc si vous n'avez pas NumPy, encore une fois, vous faites pip installer NumPy, pas de problème.

03:40 S1: Donc d'abord ce que nous voulons aller de l'avant et faire est qu'il nous faut une sorte de fonction qui va saisir les données, et nous allons continuer et utiliser l'API de Yahoo Finance. Si vous ne le connaissez pas, c'est tout à fait parfait. Il n'y a pas d'autorisation ou d'authentification qui s'y passe. C'est une information gratuite, donc vous n'avez pas besoin d'avoir un compte avec Yahoo ou quoi que ce soit de ce genre. Donc pour commencer, nous allons de l'avant et nous allons définir, et nous allons appeler ce'graph_data', et ensuite nous allons avoir un paramètre que nous allons passer, et ça va être stock. Donc ce que ça va être c'est n'importe quel stock que nous transmettez comme ce paramètre, c'est ce qui va être tiré et graphié. Donc, pour nous aider à savoir quelle compagnie nous faisons, nous allons aller de l'avant et imprimer cette entreprise, donc nous allons imprimer, et nous allons faire'actuellement', puis nous ferons, virgule, stock. Donc, pour juste dire, en train de tirer, et ensuite nous ferons un colon là-bas et il imprimera le ticker que nous tirons. Donc si vous n'êtes pas familier ... Les stocks sont identifiés par leurs tiques. Par exemple, Apple, la société qui vend des téléphones et des ordinateurs et des trucs, leur ticker ... Leur nom est A-P-P-L-E, Apple Incorporated, et vous avez leur ticker est AAPL. Ou comme un autre serait comme Tesla avec leurs voitures électriques, ils sont TSLA, donc comprenez ça. Vous pouvez toujours aller à Google et taper le nom de l'entreprise et vous pouvez trouver le ticker si vous ne le savez pas déjà.

05:05 S1: Donc de toute façon, on va tirer ça et maintenant on va écrire l'URL. Donc ce sera l'URL qui ... Et nous appellerons cette URL égale ... Et ce sera l'URL de ce ticker spécifique de l'API de Yahoo Finance. Donc on va mettre ça dans une chaîne, et ce sera'http: // api.finance.yahoo.com/instrument/1.0/ + + '' et alors ça sera ici le stock, donc c'est en fait le ticker. Donc actuellement en train de tirer, ce sera ticker, c'est le ticker de ce stock, c'est le ticker. Donc celui-ci pourrait être en théorie 'AAPL/chartdata; citation'parce que c'est un devis de prix, et ensuite nous pouvons spécifier la gamme ici. La gamme sera égale à ce que nous voulons et nous allons faire 10 ans pour l'instant. Nous jouerons avec des fourchettes à mesure que nous allons. Les API de Yahoo Finance font basculer leurs représentations de date.

06:25 S1: Donc si vous faites un court terme comme un jour ou trois jours, vous obtiendrez des horodatages qui sont des temps UNIX. Et si vous faites des délais plus longs, je pense que quelque chose après 10 jours, ce sera votre ... 10 jours et plus, il sera représenté dans des horodatages tels que vous pouvez regarder et vous les lirez. Donc, de toute façon, nous allons traiter avec les deux ou traiter les deux afin que vous sachiez comment les gérer. Mais pour l'instant nous allons commencer avec 10 ans et ensuite nous allons juste le faire / CSV et fermer notre citation là-bas. Donc, en théorie, allons-y et nous allons juste imprimer l'URL. Ok, donc nous allons descendre ici et ensuite, nous dirons comme stock ici égale et ensuite nous allons dire des entrées et ensuite des stocks comme ce'stock2plot:'Ajouter un espace car sinon, si vous le tapez, il ressemble à droite en haut de lui.

07:19 S1: Donc stock2plot, donc cela permettra à l'utilisateur de taper quelque chose dans. Donc, l'entrée nous permet simplement d'écrire dans la console. Et ensuite nous irons de l'avant et exécutez graph_data pour tout ce qui est en stock. Donc on va juste dire le stock. On passe en stock ici qui est aussi appelé stock, stock et il construit cette URL au moins. Et puis nous allons juste imprimer l'URL, et ensuite nous allons le visiter manuellement pour y regarder. Alors, allons-y et sautons et exécutez ça. Donc, je devrais faire apparaître votre consul ici. Laisse-moi la traîner. Ca ne semble pas le toucher maintenant. Alors, déplacez-le ici et disons que nous voulons faire TESLA. Ce serait donc l'URL qu'il nous nourrit. Alors, copiez cette URL et ouvrez-le dans un navigateur. Donc, lorsque nous le visitons dans un navigateur, c'est ce que nous obtenons. C'est un petit prix, alors permettez-moi de zoomer un peu pour vous. Et donc c'est les données. Donc c'était avec le CSV de 10 ans. Et donc vous pouvez voir ici qu'il y a ici des informations initiales qui sont fondamentalement inutiles pour nous. Mais si on fait défiler un peu vers le bas, ça commence à ressembler à des données assez normalisées. Donc, on peut regarder ça visuellement et faire un gander à ce que c'est.

[ rire ]

08:33 S1: voyons. Nous irons ici. Donc vous avez dit cette ligne ici. C'est le timbre dateur et nous pouvons en déduire. Cela pourrait être difficile à voir visuellement, mais nous savons que c'est l'année. Donc, 2011, le mois, donc 10 si Octobre et puis le jour, donc le 3ème. Le 3 octobre 2011, et ensuite nous avons les informations sur les prix. Et ils commandent ce genre de funky. Ils se ferment-à haute-ouverture. Et enfin, le ... Donc c'est proche, c'est le plus haut pour toute la journée, c'est le plus bas pour toute la journée, et c'est l'ouverture. Alors, quand les prix de cette journée ont ouvert, au marché ouvert, quel était le prix de l'entreprise? C'était 24.95. Pour toute la journée, quel était le prix le plus élevé? 27.6 et ensuite vous avez d'autres informations. Et puis c'est le volume, donc c'est ainsi que de nombreuses actions de cette société ont été échangées. C'est en fait un peu de volatilité de 22 à 27. Comme, oh, mon Dieu. [ chuckle ] C'était ... Il s'agit d'un stock très volatile, comme je suppose initialement. Oh, ma bonté. Ils en avaient assez ... Comme ces gammes sont massives pour les stocks de comp. Comme d'habitude vous avez 1% en un jour comme le plus. Quoi qu'il en soit, c'est donc nos données et nous allons continuer à travailler avec ça dans les tutoriels à venir, nous allons parler comment analyser toutes ces données et l'assigner aux variables, et puis bientôt nous allons le graphier et tout ça. Alors, restez à l'écoute.
00:00 Président 1: Bonjour tout le monde, et bienvenue à la quatrième partie de la Section III, qui est la visualisation de données en Python avec matplotlib. Dans cette partie, ce dont nous allons parler, c'est de créer cette fonction de conversion pour nos informations de données que nous tirons hors ligne. Donc, comme je disais que parfois la conversion des données de date afin que nous puissions le tracer dans un graphique peut être source de confusion, mais une fois que vous vous habituez à la gestion des données de date, elle ne devient plus si fastidieuse. Donc, de toute façon, dans la conversion nous avons spécifié une fonction de conversion mais nous n'avons pas vraiment cette fonction. Donc on va aller de l'avant et construire cette fonction maintenant. Donc, faisons juste une nouvelle fonction ici et nous allons l'appeler la même chose évidemment, donc octets pdate2num et puis cette fonction prend un format et ensuite il prend le codage. Et le codage va être TF8 car c'est l'encodage des données internet.

00:56 S1: Donc: ce que nous allons faire maintenant, c'est que nous allons commencer par un convertisseur de chaîne et que le convertisseur de cordes est l'équivalent des dates M qui normalement c'est comme ça qu'il a utilisé pour travailler et c'était super, mais il ne fonctionne pas tout à fait encore dans trois est égal à M dates.strpdate2num, so strip date to number and then format, fmt. Donc dans le passé, vous avez été capable de dire que votre convertisseur était fondamentalement égal à ça, n'est-ce pas? Comme ça. Donc on pouvait copier ça et coller. Et cette base ... Cela a été utilisé pour travailler dans Python 2 mais ça ne marchera pas en trois à cause de ce truc d'information. Donc, le convertisseur de cordes est égal à ça, mais nous devons faire quelques autres choses. Alors faisons un ... Nous allons créer cette petite fonction d'essai et il sera appelé le convertisseur d'octets, puis nous passerons en B ici et ensuite nous dirons S=b.decode en utilisant le format de codage ici. Donc, nous décodage UTF8, alors nous allons retourner le str_converter S alors nous retournons les bytes_ ... Ou des octets, nous n'avons pas mis le trait de soulignement. Ajoutez un trait de soulignement ici. Le trait de soulignement et le trait de soulignement.

02:34 S1: Donc, cela devrait convertir les données au format que nous voulons qui est au format de dates M. Donc on descend ici et on va de l'avant et on vient d'imprimer la date. Donc après cette longue ligne ici, imprimons la date et voyons si elle a réellement fonctionné comme nous le voulions. Donc on va juste économiser et courir vite. Nous allons continuer avec TSLA. Ok, bien sûr que nous avons tracé ces dates de M. Ok, donc ce sont tes dates et tout est gétu. Alors, même si ... Ouais, encore une fois ces dates ne signifient rien pour vous, mais ça veut dire beaucoup à matplotlib. Donc c'est le nombre que nous voulons voir, quelque chose dans les 700 000 pour l'instant. Alors, proche de ça. Cool. Donc notre conversion a fonctionné même si elle n'a pas l'air du mieux, mais maintenant nous sommes prêts à tracer quelques informations. Donc ce que nous pouvons faire maintenant c'est à la place de la date là, nous allons simplement supprimer ça. Et maintenant, nous pouvons faire pl.plot_date, donc nous notifierons à matplotlib que nous sommes sur le point de passer des dates. La date et ensuite la fermeture de P, alors nous ferons un plt.show réel rapide. Plt.show.

03:47 S1: Maintenant avec matplotlib, quand on fait une date de tracé, il n'est pas par défaut au tracé de la ligne. Il est par défaut un tracé dispersé, donc laissez-moi vous montrer, pas un éparpillé, il n'est par défaut qu'un marqueur de point, alors si nous faisons de nouveau TSLA, le graphique qui viendra ici. Bon, donc vous voyez les petits marqueurs sont ces petits points? Ok, donc nous pouvons gérer ça en fermant ici et ajouter un autre argument ici et c'est juste le type de trait, donc faites un tiret, non? Le tiret est donc deux clés à partir de votre clé de backspace. Maintenant, allons-y plus de temps. Oh, j'étais comme " Où est le graphique? Ce n'est pas éclater. " TSLA et maintenant nous avons en fait un graphique linéaire. Maintenant, laissez-moi le rendre un peu plus gros ici. Donc on peut voir que nous avons Juillet, Jan ; fondamentalement Jan et Juillet tout le chemin à travers, mais ce qui se passe, ce qui est assez cool à propos de la mise en forme de la date est maintenant que vous pouvez voir que c'est juste le mois et l'année, et vraiment pas beaucoup de mois, c'est juste Jan et Juillet, et Juillet est juste à mi-chemin. Donc, vraiment ce ne sont que tous les six mois, nous y avons un marqueur.

04:55 S1: Mais si on zoomme sur un point spécifique, tu verras ça, "Oh, on a plus de mois." D'accord? On a février et avril mais quand on peut zoomer d'un peu plus, et maintenant on a plusieurs jours à l'intérieur de Février. Et nous pourrions continuer à zoomer et vous pouvez voir maintenant que nous avons six, sept, huit, neuf, 10, 11, 12 et nous n'avons pas vraiment de données de granularité élevée ici. Mais en fait nous pourrions continuer à zoomer dans et maintenant vous pouvez voir ce sont des horodatages à cette date, d'accord? Donc, nous n'avons pas de données pour cette période, mais nous pouvons en théorie continuer à zoomer et être vraiment, vraiment, vraiment, vraiment proche. [ rires ] Quoi qu'il en soit, d'accord, donc ça a marché. Donc maintenant nous avons notre jeu de données, nous avons un graphique vraiment simple. Nous n'avons pas nos titres et nos étiquettes et tout ce truc encore. Mais ce que nous allons faire dans cette série est de personnaliser ce graphique pour inclure toutes sortes de personnalisations, de couleurs, d'options, et toutes ces bonnes choses. Donc, ça devrait être très excitant et heureusement nous ne ferons pas trop de réécriture de code, nous allons juste ajouter sur le dessus de ce graphique. Donc pas tellement de ce proverbial qui supprime cette fois. Donc, de toute façon, des séries ou des sections plutôt cool vont bientôt arriver. Alors, restez à l'écoute et merci de regarder.