Loading

Alison's New App is now available on iOS and Android! Download Now

Study Reminders
Support
Text Version

Set your study reminders

We will email you at these times to remind you to study.
  • Monday

    -

    7am

    +

    Tuesday

    -

    7am

    +

    Wednesday

    -

    7am

    +

    Thursday

    -

    7am

    +

    Friday

    -

    7am

    +

    Saturday

    -

    7am

    +

    Sunday

    -

    7am

    +

Tracements et données de chargement et de chargement

00:00 Président 1: Bonjour, tout le monde, et bienvenue à la partie 7 de la section 2 pour notre Visualisation des données avec les séries de tutoriels Python et Matplotlib. Dans cette partie, ce dont nous allons parler, c'est de nuages de points. Donc, avec ça, allons-y et nous allons commencer. Un exemple de cas où nous pourrions utiliser un nuage de points est si nous essayons de montrer des groupes ou des catégories de corrélation, des trucs comme ça, parfois vous utiliserez un nuage de points. Maintenant, couvrons un exemple où vous pouvez le faire et nous allons faire une corrélation ou un exemple de tendance. Donc je pense que nous pourrions continuer sur notre dernier exemple qui était avec ces scores de test et voir si nous ne pouvons pas trouver une sorte de corrélation avec les scores de test et le temps passé sur des tests ou quelque chose comme ça.

00:55 S1: Donc la façon dont on pourrait faire ça c'est avec une variable "time_dépensé" et de là on peut simplement remplir qu'avec les temps supposés que les étudiants ont passé au test. Donc la question est vraiment le temps passé au test, et la raison pour laquelle nous pourrions nous poser cette question est de savoir si plus de temps sur le test équivalait, en général, à une meilleure note sur le test. Donc d'ici, allons-y et nous allons commencer. Disons que les étudiants ont eu une heure pour faire le test, et c'est ainsi que les gens de longue durée y ont passé. Donc juste pour rendre facile pour moi de voir quand on sera fait, je vais aller de l'avant et ajouter un autre espace là, de sorte que tout s'approche, et qu'on commence. Donc je vais juste mettre ... Vous pouvez mettre tous les numéros que vous voulez ici. Je vais juste les faire monter. Donc nous y allons.

01:47 S1: 11 minutes, ce type a passé 10 minutes, ce type a passé 22, ce gars a passé 23, 28, 32, 54, 55, 43, 23, 53, 33, 23, 64 ... Non, on ne peut pas dépenser 64, 55, 23, 33, 38, 48, 22, 35, 37, 42, 29 et 12. Ok. Donc nous avons des scores de test et du temps passé, et nous n'avons pas besoin de bacs, et nous n'avons vraiment pas besoin de ça. Donc la prochaine chose que nous ferions est de faire un nuage de points, et la façon dont nous le faisons est avec le pied, et vous pourriez être en mesure de le deviner, scatter. Ensuite, nous allons nous disperser et nous allons juste passer le temps, puis les scores de test. Donc, l'axe des X sera le temps passé, l'axe des Y sera des scores de test. Donc on peut tracer ça et là on a ça. Maintenant, il semble y avoir une tendance à cette façon, mais c'est vraiment difficile à dire et puis aussi, c'est un très bel exemple d'un graphique qui vraiment, vraiment, nous supplie vraiment d'avoir des étiquettes et un titre, [ rire ] parce que sinon vous regardez ce graphique et vous n'avez littéralement aucune idée de ce qui se passe.

03:22 S1: Nous pourrions ... Vous pouvez peut-être faire le label "plt.x" et c'était le temps passé sur le test, puis le label "plt.y" et c'était le score de test. Ok. Et puis on pourrait aussi ajouter un titre comme "plt.title", des scores de test par rapport au temps passé, quelque chose comme ça. Nous l'avons donc et nous pouvons voir qu'il pourrait y avoir une tendance, mais ce n'est certainement pas une tendance très forte, mais bien sûr, ce n'est que de fausses données. Mais si c'était les données réelles, on dirait qu'il y a peut-être une légère corrélation mais pas vraiment forte. Quoi qu'il en soit, on dirait qu'il s'agit d'un simple et simple nuage de points avec Matplotlib, vraiment pas beaucoup plus à ça que ça.

04:15 S1: Maintenant, parfois avec des nuages de points, vous pouvez vouloir afficher plusieurs jeux de données. Ok. Comme je le disais auparavant, beaucoup de diagrammes de dispersion sont utilisés pour montrer des catégories ou des groupes aussi. Donc vous pourriez avoir quelque chose comme ça. Nous allons nous débarrasser de tout ça pour l'instant. En fait, on va laisser tout ça et ensuite on va tracer un second graphe. Ainsi, par exemple, vous pouvez avoir "X1 = Y1 =" et puis peut-être vous en avez un, deux, trois, quatre, cinq ... Cinq suffisent pour le moment. Et puis on aura deux, trois, deux, quatre, deux. Ok. Et en fait, faisons ... Disons que X est un, deux, trois, quatre, cinq, et alors nous aurons des Y différents. Et ça sera huit, huit, six, sept, six. Ok. Maintenant, vous pouvez voir quelque chose comme ça, "plt.scatterXY1 ", puis vous pouvez changer le marqueur. Donc vous pouvez dire le marqueur ... Par défaut, le marqueur est, je crois ... La valeur par défaut serait un O, donc ... Nous garderons ça, je suppose, et ensuite, faisons de la couleur égale, et ensuite on fera C pour cayenne. Alors faisons un autre, donc "plt.scatterXY2," et ensuite nous dirons que ce marqueur est égal, et nous ferons un V, je crois, sera un triangle à la hausse, et ensuite la couleur.

06:00 S1: Ici magenta et maintenant, allons faire un "plt.show" et le premier sera juste le test de la qualité, mais ensuite nous allons descendre ici et encore. Donc maintenant vous voyez que vous avez peut-être un groupe ici, puis un groupe ici. Vous pouvez donc utiliser des diagrammes de dispersion à cet égard aussi et représenter des groupes différents et voir clairement la différence d'entre eux. Donc de toute façon, c'est ça pour les nuages de points. Dans le prochain tutoriel, nous allons couvrir des tracés empilés qui sont une façon de montrer toutes les parties qui s'ajoutent à un tout et généralement c'est là que je vois que c'est fait en fait. Ainsi, nous utiliserons un exemple de dépense d'entreprise comme exemple de la raison pour laquelle vous pouvez utiliser un tracé de pile. Donc, de toute façon, c'est ce que vous devez regarder vers l'avant, alors restez à l'écoute pour ça.

00:00 Président 1: Qu'est-ce qui se passe, tout le monde? Et bienvenue dans les huit parties de notre Section II, tout sur la visualisation de données avec Python et matplotlib. Dans cette partie, ce dont nous allons parler, c'est un complot. Donc je vais aller de l'avant et supprimer fondamentalement tout sauf pour l'importation originale ici, et nous allons parler de tracés empilés maintenant. Donc l'idée d'un tracé en pile est, c'est un moyen de visualiser l'ensemble de l'ensemble, mais aussi de voir comment les pièces forment cet ensemble. Donc c'est comme un diagramme à secteurs, seulement c'est un diagramme à secteurs qui a aussi un autre axe. Donc avec le diagramme à secteurs, les diagrammes à secteurs à n'importe quel moment, il n'en a vraiment qu'une seule dimension, mais cela aura deux dimensions. Vous avez un X et un Y. Ainsi, un graphique à secteurs ne peut vous montrer qu'une tranche d'une tarte à n'importe quel moment, alors que, dans un graphique à pile, vous pouvez vous montrer les tranches de cette tarte au fil du temps. Donc c'est ce que nous allons faire maintenant.

00:56 S1: Allons-y et disons ... Supposons que nous exploitons une entreprise et que nous exploitons cette entreprise depuis 10 ans. Donc on va juste deviner un an ici et ça sera une liste, et on aura un, deux, trois, quatre, cinq, six, sept, huit, neuf, et 10. Donc notre entreprise est en vie depuis 10 ans et nous avons des dépenses. Bien sûr, une véritable entreprise n'a que des centaines de choses, mais nous en ferons quelques pour l'instant. Nous allons dire "Impôts", et nous supposerons que ces chiffres sont dans les milliers. Donc nous avons des impôts. Donc nous avons payé la première année, 17 000 $ en taxes, puis 18 000, puis 40, puis 43, puis 44 000, puis 8 000, nous n'avons pas fait beaucoup cette année-là, les 43 000, 32, 39 et 30. Donc ça devrait être un, deux, trois, quatre, cinq, six, sept, huit, neuf, 10. Oui. Ok. Donc c'est 10, maintenant on va juste dire ... Nous allons dire nos frais généraux, et ce sont juste le coût de la production pour nous de faire tout ce que le marché est que nous sommes en passe de faire. Nous dirons donc 30, 22, 9, 29, 17, 12, 14, 24, 49 et 35.

02:23 S1: Alors nous allons avoir du divertissement, et c'est comme les dépenses frivoles que nous pourrions faire dans l'entreprise. Nous le ferons 41, 32, 27, 13, 19, 12, 22, 18, 28 et 20. Cela devrait également être 10. Oui. Ok. Maintenant, ce que nous pouvons faire c'est que nous pouvons tous les empiler, donc nous pouvons faire le "plt.stackplot", et nous pouvons faire l'année, les taxes, les frais généraux, le divertissement. Donc le tracé de la pile fonctionne est qu'il faut le paramètre X et ensuite Y à l'infini comme arguments. Donc avec les méthodes que vous avez des args et des kwargs qui sont des arguments de mots clés et vous devez passer les arguments avant d'obtenir les arguments du mot clé, mais vous avez un nombre illimité d'arguments que vous pouvez passer ici pour que c'est juste dans les tracés empilés probablement comme quatre arg en args un: Ou quelque chose comme ça, et ensuite comme vos Ys pour ceux qui sont curieux. Quoi qu'il en soit, nous allons empiler ce mauvais garçon, et nous allons faire le "plt.show". Alors voyons où nous en sommes pour le moment.

03:40 S1: Donc vous y allez. Vous avez un joli tracé en pile, et c'est un peu comme ça fonctionne. Donc ce sont des dépenses d'entreprise fondamentalement même si les taxes ne seraient pas vraiment une dépense, mais nous les utilisons juste. Mais voici l'autre question quand on regarde ce graphique, on est comme "Hmm, qui est ici?" D'accord? C'est très difficile, mais malheureusement, il n'y a vraiment pas, avec un tracé en pile ne nous permet vraiment pas d'étiqueter avec des légendes. Donc, nous devons nous y mettre un peu, mais nous pouvons le faire. Donc tout d'abord ce que nous pouvons faire, c'est que nous pouvons ... Parce que ce que nous devons faire, c'est que si nous voulons gâchis une légende pour ainsi dire, ce que nous pouvons faire c'est quelque chose comme ça. On peut dire, "plt.plot", et nous ne pouvons tracer que des ensembles vides. Donc X, Y de rien et ensuite on peut assigner des valeurs. Donc on pourrait dire que la couleur ici est égale à magenta, et ensuite on peut lui donner une étiquette. On peut dire que l'étiquette est égale à la fiscalité. Et puis on pourrait dire, "plt.plot", puis de nouveau nous placerons un ensemble vide si vide set et ensuite on dirait que la couleur est égal à cyan et ensuite l'étiquette est égale à la surcharge.

05:12 S1: Et si on ne force pas les couleurs comme ça, ça va passer par les couleurs. Donc ce serait bleu, alors je pense qu'il va vert, rouge, alors il le fait, je ne sais pas, violet et noir et il passe par. Donc, si on ne force pas les couleurs, ça va simplement les cycler d'être des couleurs différentes. Mais alors on peut faire ça, donc "plt.plot", et nous allons juste continuer ici les jeux vides de couleur sont égaux, et nous allons faire ce label bleu est égal au divertissement. Et puis ce que nous pouvons faire c'est monter ... Ou en fait, vers le bas de la pile elle-même et nous pouvons passer les couleurs comme une liste. Donc nous faisons des couleurs égales, et ce sera une liste de couleurs, donc nous avons trois couleurs. Et si nos impôts, on est magenta.

06:00 S1: Et alors notre temps système était cyan, et maintenant nous avions un B pour le divertissement. Donc maintenant nous avons les couleurs appropriées, et puis tout ce que nous avons à faire est d'appeler "plt.légende", et pendant que nous y sommes, faisons un "plt.titlecompanyCharges", plt.xlabel " sera l'année. Et puis "plt.ylabel" coûtera en milliers. Quelque chose comme ça. Ok. Allons sauver et courir ça. Et maintenant ... Oops on a oublié ... Oh, nous avons fait "plt.légendes" sans les parmes là-bas. Quoi qu'il en soit, nous y allons. Et maintenant nous l'avons fait. Donc nous pouvons voir, d'accord, c'est comme ça que nous dépensons pour le divertissement. Nous avons vraiment réduit les divertissements ces années. Répartir de nouveau sur le divertissement et les frais généraux. Et nous avons payé beaucoup moins d'impôts, regardez comment ça a fonctionné pour nous. Quoi qu'il en soit, c'était de la chance, avança. Nous avons donc nos couleurs et nous pouvons voir. Mais encore une fois, nous voyons comment notre légende est en fait en ce moment, mais nous pouvons faire bouger les choses et faire ça. Nous y allons. C'est toujours en chemin. Il n'y a aucun moyen de s'éloigner de ce problème. Une chose que vous pouvez faire en fait. Si vous utilisez le bouton de zoom, vous pouvez cliquer dessus. Et normalement, vous cliquez et faites glisser pour zoomer, mais si vous maintenez le bouton droit de la souris au lieu de cela, il zoome en fonction de ce que vous avez choisi.

07:26 S1: Donc gardez ça à l'esprit'parce que vous pouvez faire des trucs comme ça. Donc maintenant ce que nous pouvons faire comme ça et nous forcer à avoir plus d'espace dans notre graphique. Ce serait mieux que nous puissions kinda cheat. Quoi qu'il en soit, d'accord, alors c'est juste des tracés empilés et des zooms, et tout ce que kinda fun et aussi kinda mystification d'une légende. Donc il y a des choses qui complote qui ne le font pas, avec des légendes sont probablement les plus communes que ça ne fonctionne pas. Mais pile terrain, et j'essaie de penser à certains des autres comme des remplissettes. Si tout ce que vous tracez est rempli, ce n'est pas un complot et donc ce n'est pas le cas. Donc en gros tout ce qui est polygone. Donc tout ce qui remplit les lignes, en général, ne sera pas une légende. Mais vous pouvez toujours faire ça pour créer une sorte de légende fakish. Je ne sais pas vraiment pourquoi ils ne font pas quelque chose comme ça en arrière-plan, même si c'est juste un remplissage et que vous voulez vraiment avoir une étiquette. Mais ils ne le font pas. Donc, de toute façon, vous devez vous y départir. Mais c'est bon. Donc de toute façon, c'est des tracés empilés et dans le prochain tutoriel, puisque nous parlions de la façon dont les tracés de pile sont comme des diagrammes à tarte avec un calendrier, nous allons parler des graphiques circulaires à côté. Donc, de toute façon, restez à l'écoute. Merci d'avoir regardé.

00:00 Président 1: Qu'est-ce qui se passe sur tout le monde? Bienvenue à la partie 9 de la Section 2 avec la visualisation de données à l'aide de matplotlib en Python. Dans cette partie, ce dont nous allons parler, c'est des diagrammes à secteurs. Donc, l'inclusion plutôt sympa à matplotlib est des diagrammes à secteurs, et ils font quelques belles choses en coulisses pour nous, comme la conversion automatique en pourcentage du gâteau, et ainsi de suite. Donc, avec ça, allons-y bien. La première chose que nous allons faire est la suppression habituelle de tout sauf pour cette première importation et nous sommes prêts à gronder. Donc, avec des graphiques circulaires à matplotlib, vous lui donnez généralement le ... Supposons que votre X est votre quantité de tarte, et ensuite votre Y serait vos étiquettes, et ensuite vous pouvez passer par les couleurs, si vous voulez, et ensuite vous pouvez passer un angle de départ, même, si vous voulez, si vous voulez que votre petit diagramme à tarte soit bien orienté, vous pouvez faire ça, et ensuite vous pouvez aussi remplir en pourcentages aussi si vous le voulez, je vais vous montrer comment faire avec le code de matplotlib, et c'est à ce sujet.

01:07 S1: Alors, allons-y et on commence maintenant. Donc la première chose que nous allons faire, c'est que nous allons assigner des étiquettes. Les étiquettes seront une liste ou un tuple, mais nous allons en faire un tuple pour le moment. Et ce sera juste les tranches, elles vont être commandées, et elles seront tracées de cette façon, et en général les tracés iront dans le sens contraire des aiguilles d'une montre, juste au cas où vous vous en souciez vraiment. Donc, nous avons nos impôts, nous avons nos frais généraux, et nous avons notre ... Et oops ! Nous avons notre divertissement. Ok. Et puis nous allons dire nos tailles, et nous allons faire cette liste, les tailles seront 25, 32, 12. Et puis nous spécifions les couleurs. Je ne me souviens pas vraiment de ce que les couleurs étaient avant, mais nous le ferons, faisons cyan, magenta, et je pense que nous avons fait du bleu. Nous ferons ça, je ne suis pas sûr que ce soient ceux qui se rapportent spécifiquement à ces questions, mais ça ira bien. Maintenant, ce que nous allons faire c'est que nous pouvons faire plt.pie et ensuite nous passer le X, qui était des tailles. Ensuite, nous avons vos étiquettes, et en fait les étiquettes doivent être des "étiquettes" parce que tout ce que vous avez à faire ... Vous pourriez vraiment probablement échapper à des tailles de passage, je suis presque sûr. Allons-y et exécutez un plt.show, voyez ce qui se passe.

02:42 S1: Oui, donc ça vous donnera un graphique à tarte sans vraiment quoi que ce soit, [ chuckle ] pour que ça va. Et une autre chose que nous pouvons faire aussi bien est de faire "l'axe plt" et nous pouvons passer à égalité ici, faisons juste nous assurer, voir ce que ça fait pour nous, pas vrai. Donc, si vous remariez, la valeur par défaut était un diagramme à secteurs incliné. Les gens aiment faire ces diagrammes à secteurs inclinés pour une raison quelconque, mais si vous ne voulez pas qu'il soit incliné comme ça et genre de distorsion, vous pouvez utiliser l'égalité là et cela ne le fera pas. Maintenant, parce que ces tailles ne signifient pas beaucoup pour nous sans étiquettes, nous allons ajouter des étiquettes et nous allons aussi forcer ces petites couleurs comme nous l'avons fait auparavant. Donc la tarte, vous avez des tailles, puis on dira que les étiquettes sont des étiquettes, et puis on dira que les couleurs sont égales aux couleurs, on peut passer l'angle de début et on dit que c'est égal à 90, d'accord? Alors, allons-y et exécutez ça maintenant. Et maintenant vous pouvez voir que nous avons nos étiquettes. C'est notre impôt, c'est notre dépense de divertissement, et c'est notre temps système, donc c'est ça. Et l'angle de départ, en passant, vous avez commencé à 90 degrés d'angle, c'est pourquoi, donc voici votre ligne droite et descendante, et puis encore, les choses sont tracées dans le sens contraire des aiguilles d'une montre, donc vous avez des taxes, des frais généraux, des divertissements, et c'est pour ça que ça a fait ça comme ça.

04:05 S1: Maintenant ... Ah oui, donc les pourcentages sur le tableau réel, vous pourriez faire quelque chose comme ça. Auto pct égal, et ensuite vous pouvez utiliser %1.1f%%, et maintenant essayons maintenant plus de temps, et maintenant vous pouvez voir que vous avez vos pourcentages ici. Donc vous pouvez le faire. Une autre chose que nous pouvons ajouter est une "ombre égale true", donc cela devrait ajouter une petite ombre à elle, pour que vous puissiez voir un élément en trois dimensions. Donc maintenant nous avons fait l'ombre, peut-être que ça ne sera pas si défiant sans le truc. Je ne sais pas, j'ai encore l'impression que ça me semble vraiment déformé pour une raison, je ne sais pas, je n'aime pas vraiment ça. Vous pouvez néanmoins vous faire part de votre propre esprit. Mais, je ne l'aime pas. L'ombre va bien, mais ça ne me déra pas.

05:01 S1: Donc, j'ai une ombre, et une autre chose que nous pouvons faire c'est d'ajouter une explosion. Donc une explosion est un peu où nous tirons un morceau un peu, par exemple, on pourrait ajouter exploser, donc on pourrait dire "exploser est égal", et ensuite on peut passer, puisque nous avons trois éléments dans ce graphique circulaire, vous pouvez avoir zéro, zéro et zéro, oops, et pour faire exploser quelque chose juste un petit peu, on pourrait faire 0,1. Donc ça veut dire que ... Oops, on a oublié notre virgule. Cela signifie que la seconde pièce, donc les frais généraux, sera un peu sorti un peu, comme si nous étions sur le point de manger un morceau de cette tarte. Donc vous y allez, il est sorti un peu. Mais on pourrait le sortir un peu, [ rire ] de sorte que vous pouvez voir qu'il est sorti vraiment loin. Tu pourrais aussi ... Vous pourriez tous les retirer si vous le vouez. Vous pourriez faire 0,1, 0,1 et 0,1, quelque chose comme ça et alors ils seraient tous en quelque sorte l'un de l'autre et des trucs comme ça.

06:11 S1: Ok, c'est à propos de ça avec des graphiques circulaires. Mais comme vous pouvez le voir, il y a beaucoup de petits trucs de personnalisation que nous pouvons faire. Donc, c'est plutôt cool. Dans le prochain tutoriel, ce dont nous allons parler, c'est de charger des données à partir de fichiers. En fait, les deux prochains tutoriels, c'est ce dont nous allons parler. Donc, ce serait une sorte de première entrée dans les données de lecture provenant d'autres sources ou autre, mais beaucoup de fois les gens ont des données qui sont peut-être dans un fichier CSV ou même un fichier texte, mais il est généralement séparé par quelque chose.

06:41 S1: Nous pouvons donc utiliser les méthodes pour ouvrir les CSV à peu près n'importe quel fichier, même chose avec des fichiers texte. Et donc, nous parlerons d'abord du module CSV natif que nous ... Ça fait partie de notre bibliothèque standard avec Python. Parlez de la façon d'utiliser cela pour ouvrir un fichier CSV et ensuite nous parlerons de l'utilisation de NumPy pour le faire également. NumPy est un peu mieux à faire presque tout. C'est un module très efficace alors que les modules CSV ne sont pas vraiment très bien, mais pour les petits fichiers, vous ne remarquerez probablement pas la différence. Mais de toute façon, c'est ce que vous devez regarder vers l'avant, alors restez à l'écoute. 00:00 Président 1: Bonjour, tout le monde, et bienvenue dans le 10ème tutoriel de programmation avec la visualisation de données en Python à l'aide de Matplotlib. Dans ce tutoriel, ce dont nous allons parler, c'est de charger des données à partir d'un fichier CSV. Donc, pour faire ça, on va aller de l'avant et utiliser le module CSV. Tout d'abord, la proverbiale "supprimer tout". Ok, et maintenant nous sommes prêts à continuer.

00:26 S1: Donc, j'ai codé tout notre code dans ce petit répertoire de code vidéo. Donc c'est là que nous allons aller de l'avant et mettre ce script aussi. Si vous êtes sous Windows, vous pouvez coder avec des chemins locaux, si vous n'êtes pas sous Windows, vous devez toujours donner le chemin complet, mais allons-y et créez un nouveau fichier. Et je vais appeler ça, "exemple." Et pour l'instant, c'est un fichier texte. Nous devrions être en mesure d'obtenir un fichier texte. Cela ne devrait pas avoir d'importance, mais vous pouvez aussi en faire un CSV ou tout ce que vous voulez. Mais dans cet exemple de fichier, je vais avoir un, deux, trois, quatre, cinq, six, sept, huit, neuf, et dix et dix nous allons de l'avant et ajouter quelques virgules, pas des périodes. Comma, virgule, virgule, virgule, virgule, virgule, virgule. D'accord, et puis ce que nous allons faire, c'est comme nos Xs et ensuite nous allons ajouter des Ys, allons faire quelques trucs. Tu n'as pas à me copier parfaitement. Ce 78 va devoir être autre chose. C'est là que tu y vas. Ok, donc, sauve l'exemple là et c'est essentiellement ça. Tutoriel sur. Non.

01:32 S1: Nous allons la mettre de côté maintenant. Et dans notre code, nous voulons pouvoir faire référence à cet exemple de fichier. Donc, ce que nous allons faire, c'est que nous allons dire ... Tout d'abord nous devons importer CSV et cela fait partie de votre bibliothèque standard chaque installation de Python au moins après trois devrait en être sûr, je suis plutôt sûr qu'il arrive aussi en deux. Et ne faisons qu'une liste vide de X et Y. Maintenant, ce que nous allons faire, c'est que nous allons dire avec ouverture et ce sera l'exemple, et j'ai fait le mien dans un fichier texte, donc je vais juste avoir l'exemple du texte avec l'intention de lire comme fichier CSV, nous allons dire que les "tracés égaux CSV.reader" et il va lire le fichier CSV et le délimiteur est une virgule, une virgule, donc vous pourriez avoir à peu près n'importe quel délimiteur que vous voulez. Comme par exemple quand je fais peut-être des données textant, comme je disais avant de travailler avec le traitement de la langue naturelle, beaucoup de gens ont des commentaires. Donc, en général, mon délimiteur est comme un double deux-points comme ça " cause qui ne se produit jamais vraiment dans le texte, donc c'est ce que je vais utiliser. [ rire ]

02:52 S1: En tout cas, donc vous avez des tracés est égal à ça et ensuite on va dire quatre rangées dans les parcelles, on va dire "X.append" et parce que nous sommes en train de lire du texte, ça passe sous forme de ficelle. Donc nous devons convertir, donc si vous avez des flotteurs là, vous le convertisseriez en un flotteur, mais nous savons que c'est dans le fichier, c'est tous les entiers. Donc nous allons convertir en int, puis la ligne et l'élément zéro de cette ligne est notre X, et notre Y est la valeur int de la ligne avec le premier élément. Cool. Donc, maintenant nous allons faire ... C'est essentiellement ça avec ça. Donc nous avons peuplé X et Y, donc tout ce que nous avons à faire maintenant est de le tracer. Donc, "plt.plotXY", le label va être chargé à partir du fichier et ensuite nous allons avoir "plt.xlabel" et ce sera notre numéro de tracé, alors "plt.ylabel" sera choisi au hasard le numéro du tutoriel et ensuite nous irons de l'avant et avons un "plt.légende" et nous allons faire "plt.title" et nous appellerons ça, "graphe génial." Et enfin, notre "plt.show". Alors économisons et exécutez ça, et nous y allons, et il y a nos informations chargées à partir de notre exemple de fichier.

04:36 S1: Maintenant, c'est avec le module CSV et dans le tutoriel suivant, nous allons voir comment utiliser le module NumPy qui est un module tiers. Ça ne vient pas avec Python, mais c'est un module super utile. Vous pouvez en fait l'avoir en fonction de la façon dont vous avez installé matplotlib. C'est aussi probablement l'un des modules les plus populaires aux côtés de matplotlib que les gens ont juste parce qu'il s'agit d'un module aussi utile. Donc, de toute façon, c'est ce à quoi nous allons parler dans le prochain tutoriel, alors restez à l'écoute. 00:00 Conférencier 1: Qu'est-ce qui se passe, tout le monde? Bienvenue dans la 11ème partie de notre seconde section pour la visualisation de données avec Python et matplotlib. Dans ce tutoriel, nous allons parler de l'utilisation de NumPy pour charger des données à partir de fichiers. NumPy est donc généralement une méthode plus rapide pour charger des données à partir de fichiers et vous pouvez aussi faire un certain nombre de crunching au fur et à mesure que vous les chargez. Nous ne parlerons pas vraiment trop de ça, mais nous voulons montrer à l'aide de NumPy tout simplement parce que dans le bas de la route, vous vous ferez probablement très bien avec NumPy et l'utiliser pour importer des données à partir de fichiers ne fait qu'un tout bon sens. Donc c'est ce dont nous allons parler ici. Donc, on va aller de l'avant et en gros partir ... On va juste supprimer ça. Et puis, nous avons besoin d'obtenir NumPy. Tout d'abord, assurez-vous d'avoir NumPy. Alors essayez d'importer NumPy, par exemple, dans un ... Il suffit d'ouvrir IDLE et d'importer NumPy. Et si vous pouvez importer NumPy, gérez. Si tu ne peux pas, tu dois l'obtenir. Pour l'obtenir, vous feriez pip installer NumPy comme ça.

01:11 S1: Si cela ne dit pas de programme ou quoi qu'il en soit trouvé pour pip, vous faites simplement SQL/Python quelle que soit votre version, la mienne est 3.4 donc Python34/scripts/pipinstallNumPy. Alors, assurez-vous d'avoir NumPy et ensuite ce que nous allons faire, c'est que nous allons dire X, Y ... Alors oui, nous n'en avons pas besoin. X, Y = NP.loadtxt et vous spécifiez le fichier texte ou ... Encore une fois, c'est comme CSV, non? Avec CSV, nous avons chargé un texte ; ici avec du texte de chargement vous pouvez charger un CSV, il n'a pas d'importance. Donc chargez le texte et ensuite on va dire exemple.text. Alors on va dire ce que notre délimiteur ... Oops, ce n'est pas censé être entre guillemets. Délimiteur est égal à virgule, et ensuite nous allons dire que le déballer est vrai. Donc le déballage est essentiellement ce que nous faisons ici. Donc, quand vous avez une fonction et que vous définissez simple et que cette fonction retourne cinq et sept, disons, et vous dites ... Faisons Y, U est simple, ce que vous faites, c'est que vous attribuez cinq à Y et huit à U, et c'est ce qu'on appelle déballage.

02:47 S1: Donc si vous venez de le faire, comme Y égale simple, Y serait égal à cinq, huit comme un tuple. En fait, en fait, ça ne fonctionne peut-être même pas, mais c'est très rapide. NumPy non défini. Nous devons donc importer NumPy. Alors, faisons d'abord importer NumPy comme NP. Faisons ça une fois de plus. X et Y doivent avoir la même ... Oh, je sais ce que nous avons fait. Ce que nous devons dire comme je suis simple. Nous essaierons à nouveau. J'essaie juste de l'exécuter. Ok, donc ça a fait du travail. Donc si on arrive ici ... Tout d'abord, ce graphique a effectivement été chargé et si nous venons ici et nous demandons ce qui est. .. Oh, attends, bien, le graphique est en hausse, alors fermez le graphique et nous disons que maintenant, je suis en effet égal au tuple de cinq, huit. Mais si nous disons comme UI d'égale simple, nous dévalons ces valeurs. Donc, UI et donc c'est en gros ce qui se passe ici. Lorsque nous disons que le déballer est vrai, nous décompresons les valeurs qui sont divisées par ce délimiteur commun, nous les décompresserons dans l'ordre de XY par ligne.

04:04 S1: Donc, comme vous pouvez le voir, nous avons enlevé quelques lignes qui ont été utilisées pour l'ensemble de l'opération CSV. Donc vous pouvez voir que c'est même la programmation sage beaucoup plus efficace, mais NumPy est un module C accéléré pour qu'il utilise la langue de C et dans beaucoup de cas beaucoup plus vite. Ce n'est pas tout ce que vous pouvez faire avec NumPy non plus et vous pouvez charger des fichiers qui ont des timbres de date et les convertir et toutes sortes de trucs de fantaisie.

04:31 S1: Donc, de toute façon, c'est pour charger des données avec NumPy, et vraiment les deux façons populaires de charger des données dans matplotlib. Un autre serait avec Pandas ou quelque chose comme ça, mais c'est un tout, un autre tutoriel. Donc, de toute façon, c'est pour charger des données avec NumPy.