Gestion des données d'attribut et Exploration des données | Alison
Loading
Notes d'étude
Study Reminders
Support
Text Version

Gestion des données d'attribut et Exploration des données

Set your study reminders

We will email you at these times to remind you to study.
  • Monday

    -

    7am

    +

    Tuesday

    -

    7am

    +

    Wednesday

    -

    7am

    +

    Thursday

    -

    7am

    +

    Friday

    -

    7am

    +

    Saturday

    -

    7am

    +

    Sunday

    -

    7am

    +

Bienvenue aux chers étudiants. Nous sommes maintenant dans le module 3 et nous parlerons de l'attributData Management and Data Exploration dans ce cours particulier.
Ainsi, les concepts que nous allons couvrir aujourd'hui concernent les statistiques descriptives et nous allonsdes statistiques unidimensionnelles, nous allons également parler des statistiques multivariées, nous allons voir ce qui est des statistiques inférentielles, nous allons également examiner les typesdes attributs de données et la manière dont les données sont gérées dans le SIG.
Donc, comment nous faisons l'entrée des données d'attribut, comment nous faisons la conception de la base de données, qu'est-ce qu'une base de donnéesRelationnelle et que je veux dire différents types d'opérations de données concernant l'assemblage des tables. Par conséquent,nous allons examiner les concepts suivants.
 
Par conséquent, en parlant des statistiques descriptives ou unidimensionnelles, il est utilisé pour les variables ordinaleset les variables de rapport et il ne peut pas être utilisé pour des variables nominales ou catégorielles. Nous verronsquelles sont ces variables nominales et catégorielles. Certains d'entre vous connaissent peut-être cesqui sont dans la gestion des données et je veux dire la conception de la base de données et toutes ces choses.
Ainsi, il résume essentiellement l'observation avec des statistiques descriptives, il donne un résumé deles observations et il est en référence à la distribution d'une variable. Ainsi, chaque fois que nousavons des variables et que nous avons distribué des données ou des données discraires, elles sont regroupées ou regroupées en
différentes classes ou valeurs groupées et nous avons des fréquences d'occurrence pour chacun de ces groupesqui peuvent être affichés sous forme d'histogramme des différentes classes.
Maintenant, je veux dire que le nombre de classes que nous catégorisons nos données est déterminé comme une fonctiondu nombre d'observations et de la plage des valeurs. Maintenant, en parlant des mesuresdes tendances centrales, nous avons trois mesures que vous connaissez déjà. La premièreest connue sous le nom de moyenne, c'est-à-dire la moyenne de tous les ensembles d'observations.
Donc, si nous avons n nombre d'observations, nous additionnons les observations que je veux dire toutes les observations “ n ”et divisons cela par le nombre d'observations pour nous donner la moyenne qui est désignéecomme mu. A présent, la mesure suivante de la tendance centrale est la médiane qui est la valeur moyenne médianelorsque toutes les valeurs sont commandées si nous voulons que les valeurs soient empilinées entre les valeurs les plus petites et les plus grandes.
Donc, vous pouvez trouver la valeur moyenne et si vous avez un nombre pair de fichiers, dans ce casce que nous faisons, c'est que nous prenons les deux valeurs moyennes et je veux dire prendre la moyenne de ces valeurs. Maintenant, vousavez différents types d'algorithmes dans l'ordinateur I, l'analyse logicielle. Donc, nous pouvons dire quecatégories les données ou je veux dire enregistrer les données dans un que je veux dire la plus petite à la plus grande je veux dire la commande. Par conséquent,ces différents algorithmes sont disponibles là où, si nous avons un ensemble de données très important, il peut être commandé paret ensuite nous pouvons trouver la médiane.
Maintenant, le mode est la valeur la plus fréquente dans un fichier. Par conséquent, quelle que soit la valeur de donnéesla plus fréquente, je veux dire que nous le prenons en mode. Maintenant, si nous avons des valeurs aberrantesdans les données, si nous avons certaines valeurs de données qui sont des valeurs extrêmes de données, je veux dire queest au-delà de la valeur centrale de l'une des tendances centrales et qui a des valeurs très élevées, doncdans ces cas, ce qui se passe ces valeurs aberrantes va s'ajouter de manière significative à la moyenne. Donc, d'une certaine façon, lasignifie que je veux dire affectée par ce genre de valeurs aberrantes. Par conséquent, la valeur médiane moyenne ou la valeur de mode réduitl'impact des valeurs éloignées.
 
Donc, je veux dire que nous parlons des statistiques descriptives. Donc, nous avons trois mesures, en gros, nousparlons de l'écart-type où, dans nous, le degré de dispersion autour de la moyenneet il est représenté comme sigma qui est la différence de la moyenne quadratique de vos valeurs observéesà la moyenne est divisé par le nombre total d'observations et il est pris enqueune racine carrée.
Nous avons également un terme qui est connu sous le nom de Variance qui est, je veux dire, largement utilisé dans les SIG oudans les statistiques descriptives. Donc, je veux dire que c'est l'attente de l'écart carré lorsque la variableest aléatoire par rapport à sa moyenne, maintenant je veux dire qu'elle nous donne un écart de ces nombres aléatoirespar rapport à la valeur moyenne par rapport aux valeurs moyennes. En parlant desur le coefficient de dérapage lorsque nous avons une distribution a, lorsque nous avons un histogramme, nous pouvons voir qu'il peut être sous la forme d'une courbe inverse de cloche.
Cette courbe peut donc être symétrique ou être de nature asymétrique. Ainsi, le coefficientde la asymétrie, il mesure le manque de symétrie ou la présence de symétrie dans la distribution des donnéeset il est mesuré à l'aide du coefficient de temps de Pearson ’ qui estdonné par cette équation particulière affichée ici.
 
En ce qui concerne les statistiques multivariées, en général, je veux dire qu'il s'agit de données qui ne sont pasunivariées, mais qu'il s'agit d'une multivariable dans laquelle, dans notre cas, nous avons une variable dépendante et que nous pouvons avoir plusieurs variables indépendantes.
Donc, je veux dire que vos statistiques univariées ne peuvent pas être utilisées pour analyser une telle situation. Donc, je veux dire à nouveauquand nous avons parlé de données univariées en cas d'analyse multivariée, comme je, il n'est pas possible pour nous d'analyser les variables nominales ou catégorielles, donc nous pouvons comme moi
disait que nous pouvons explorer s'il existe une relation entre deux ou plusieurs variables.
Si vous avez deux variables, alors il s'agit d'un nuage de points que vous pouvez avoir abscisse etordinate x-axis et y-axis et les graphiques de données les valeurs de données seraient éparpillées sous forme de papierpot, je veux dire diagramme comme je veux dire des points dans l'axe x et l'axe des Y. Par conséquent, si vous disposez d'un jeu de données tridimensionneldans lequel vous pouvez avoir une variable dépendante indépendante et deux variables indépendantes, dans ce cas, cela ressemblerait à un nuage de points et, de la même manière, si vous avezplus de variables, le nombre de variables qu'il devient devient compliqué.
Par conséquent, je veux dire que nous pouvons inclure plusieurs variables, mais l'avantage de ces statistiques descriptives multivariéesest que nous pouvons évaluer simultanément la relation entreplusieurs variables. Maintenant, pour effectuer cette évaluation, il existe deux méthodes. Nous parlons de la corrélation et nous parlons de régression.
Par conséquent, dans la corrélation et la régression que nous avons la nature, nous explorons la nature des relationsentre les différentes variables et nous essayons d'évaluer un qui est la force des relationsentre ces variables. Donc, quand nous avons ces variables, ce que nous pouvons faire c'est que nous pouvons ajuster une ligneà ces points de données et cette ligne est la ligne de la meilleure forme, c'est-à-dire la ligne qui passe parce nuage de points est mis au point. Donc, il est aussi proche que possible de tous les points et il représente Isignifie cette ligne particulière ou la ligne la mieux adaptée qu'elle représente la tendance des données.
Donc, supposons que nous ayons ces points de données et que nous essayons de créer ces points de données éparpillés les tracésdans ce x, y et z valeurs deux variables qui sont y et z. Donc je veux dire si nous essayons de faire un tracé de la meilleure forme, alors ce qui se passe est que vous pouvez découvrir les distances et que ces distances seraientminimisées, ces distances à partir de ces points seraient minimisées, de sorte qu'il s'agit de la meilleure ligne.
 
Maintenant, si nous voyons l'équation de la meilleure ligne d'ajustement, elle est dans la forme y égale mx plus c où dansnous avons la pente et nous avons l'intersect. Ainsi, dans cette équation particulière, zi est égal à I moyen de sous-script bêta 0 plus le sous-script bêta 1 y i dans cette version bêta 0 représente la penteet la bêta 1 représente les coefficients d'interception. Donc, nous voyons cette équation particulière dans cevotre z i est égal à beta 0 beta subscript 0 plus beta subscript 1 yi.
C'est l'équation de cette ligne particulière qui est la ligne de la meilleure forme dans laquelle elle est aussi proche que possible deà tous les points. Nous verrons donc comment nous minimisons cette distance par rapport à tous ces points. Donc, dans ce cas, c'est de la forme y est égal à mx plus c. Ainsi, nous voyons le sous-script bêta0 et le sous-script bêta 1 sont les coefficients d'interception et de pente.
 
Maintenant, on a parlé de ce que je veux dire de la meilleure ligne d'ajustement. Donc, c'est l'équation de régression. Cette équationdont nous avons parlé est l'équation de régression. Maintenant parlant de la pente decette ligne particulière qui est la version bêta 1, je veux dire calculée à l'aide de cette équation particulière, je veux dire, elle vous donne le rapport de la hausse le long du x au rapport d'élévation le long de l'axe y. Donc, dans ce casil est donné par cette équation particulière. De la même façon, nous pouvons calculer le calcul de l'interceptionpar cette équation. Encore une fois, il s'agit de soustraire la moyenne de votre z à la moyenne de la bêta 1.
 
Parler du coefficient de corrélation qui nous donne la force et la nature de la relationentre les variables, de sorte qu'il nous donne la mesure dans laquelle les points de dispersion sontautour de la droite de régression. Il s'agit donc d'un rapport de nouveau et il est utilisé à l'aide de cette équationparticulière et nous pouvons voir que le r qui est le coefficient de corrélation, il va de moins 1 àpositif 1.
Maintenant, lorsque nous avons des valeurs positives de r, cela indique une corrélation positive et lorsque nous avons des valeurs de r négativescomme négatives, cela indique que nous avons une corrélation négative. Maintenant, le coefficient de déterminationqui est également connu sous le nom de r carré ou dans certains cas, vous verrez qu'il y a des valeurs de carré ajusté, cela donnerait l'indication de la bonté de l'ajustement. Maintenant, c'est le carrédu coefficient de corrélation que nous avons vu plus haut et cela, je veux dire, nous donne le pourcentage de variationdans les données qui est expliqué par la ligne de la meilleure forme.
 
Maintenant, parler de statistiques inférentielles lorsque nous avons une population énorme, nousne pouvons pas faire un échantillonnage de l'ensemble de la population. Donc ce que nous pouvons faire, nous pouvons prendre un échantillon dela population et cet échantillon doit être significatif. Donc ce que nous faisons dans les statistiques inférentielles, nousavons essayé de voir ou de tester l'importance. Donc, ce test de signification est entre les différents groupes, c'est-à-dire que nous essayons de mesurer le degré de différence entre les différents échantillonsde la population. A présent, ces statistiques inférentielles nous aident à considérer la probabilitéde l'instruction sur un paramètre donné.
Alors, lorsque nous parlons d'une hypothèse avant de faire une recherche, nous nous référons donc à ces statistiques inférentiellespour voir si l'hypothèse est correcte ou incorrecte. Donc, nous parlons deà propos de deux cas en termes d'hypothèse 1 est l'hypothèse nulle et l'autre est l'hypothèse alternative. Ainsi, lorsque nous faisons ces statistiques inférentielles, nous pouvons conclure que s'il y a une différence significative deentre les deux groupes, je veux dire entre les paramètres statistiques de la
deux groupes qui sont la moyenne ou l'écart type si les deux groupes étaient significativementdifférents pour la population.
Donc, il nous donne l'hypothèse nulle et l'autre est votre hypothèse alternative, c'est-à-dire lorsquel'important est une différence significative dans la population, il donne l'hypothèsealternative et nous avons aussi le niveau de signification qui est défini comme alpha et il est définicomme la probabilité que l'hypothèse nulle est correcte et si elle est statistiquement significative, je veux dire que c'estimprobable que l'observation ou l'échantillon se soit produit par hasard.
 
Donc, c'est comme ça que nous utilisons la moyenne ou que nous pouvons utiliser vos statistiques univariées, les statistiques multivariéesou les statistiques inférentielles. Nous avons donc plusieurs autres matrices de statistiques inférentielles. Le premierest l'erreur standard où dans nous essayons de mesurer l'intervalle de confiance qui est le, ce qui nous donne la moyenne de l'échantillon et la différence moyenne de la population. Par conséquent, si cette erreur est faible
Cela signifie que la confiance est plus grande que les deux moyens sont plus proches les uns des autres. A présent,l'erreur standard est le rapport de l'écart type par rapport à la racine carrée du nombre d'observationsdans l'échantillon.
Nous avons également une mesure connue sous le nom de statistique t qui évalue la différence entreles deux méthodes d'échantillonnage. Il est calculé à l'aide de cette équation particulière qui est r en racine sur nmoins 2 divisé par 1 moins r carré. Maintenant, nous analysons également la variationdans les colonnes de données et entre les colonnes de données. Il peut donc être fait à l'aide de cette méthodeparticulière, appelée ANOVA, qui est l'analyse de la variance.
(Référez-vous à l'heure de la diapositive: 18:07)
Donc, à part cela, nous pouvons aussi savoir comment vos données spatiales et les données aspatiales sontdifférentes les unes des autres. Ainsi, si nous exécutons les inférences statistiques sur les données spatiales, nous pouvons voirqu'il y a une différence entre les ensembles de données spatiales et les ensembles de données aspatiaux. Il doit
être traité différemment, de manière à ce que votre prémisse lorsque nous traitons de données aspatiales,n'importe quel type d'analyse statistique dont nous avons parlé s'il s'agit de statistiquesunivariées, multivariées dans ce cas, l'hypothèse est qu'il existe une indépendance dans l'observation des exemplesqui est la valeur d'une observation n'est pas affectée par les autres observations dans le fichier.
Mais lorsque nous parlons de l'analyse des données spatiales dans le monde réel, nous verrons que les observationsdans les variables spatiales du domaine spatial, elles sont souvent similaires aux valeurs voisines de. Ainsi, d'une certaine façon, lorsque nous analysons les données spatiales, nous devrions avoir une approche différente de, une approche nettement différente de celle que nous utilisons pour une analyse de donnéesspatiale.
 
Maintenant, en parlant de la gestion des données, nous pouvons définir chaque zone de la table de données où, dans, nous donnons le nom de zone, nous pouvons spécifier la longueur de la zone qui est le nombre de chiffres à êtreréservé à une zone. Nous pouvons également indiquer au type de données que ces données sont des entiers, qu'elles sont flottantes ou queest une information de texte, qu'il s'agisse d'une date ou d'une devise et que nous pouvons également indiquer le nombrede chiffres décimaux dans le cas où les données sont un type de données à virgule flottante.
Donc, je veux dire que lorsque nous faisons cette analyse, nous pouvons commencer par des fichiers plats. Donc je veux direquand on a plus de données, on peut alors entrer dans une base de données relationnelle. Si nous avons un jeu de données énorme, nous pouvons créer une base de données relationnelle et nous pouvons être plus faciles à gérer dansde ce type lorsque nous utilisons la gestion de base de données relationnelle pour traiter une quantité énormede données.
 
En parlant des différents types de données d'attribut, nous avons le nombre binaire de date texte ougrand objet binaire de grande taille qui est également connu sous le nom de données BLOB. Lorsque nous parlons de numéros, nous traiterions soit des nombres réels, soit des nombres entiers. Par conséquent,peut avoir des valeurs entières ou des valeurs flottantes. Par conséquent, lorsque nous codons les données spécialement pourle type de données tramées, nous devons être très prudents quant au type de fichier que nous sommes en train de créer, car supposons que si vous disposez d'une opération à virgule flottante et que votre type de données vous définitcomme un nombre entier, il émettrera toutes les valeurs flottantes.
Nous devons donc être très prudents quant au type de données que nous manipulons. Donc,spécifiquement dans le cas de raster. De la même façon, nous pouvons avoir des données sur les flotteurs. Donc, la résolution des données aussiserait prise en compte lorsque nous avons affaire à un ensemble de données matricielles. Il peut s'agir d'une donnée de 2 bits, il peut s'agir d'donnée de 4 bits ou de 8 bits, de données de 12 bits en fonction de la taille de la différencemoyenne des valeurs les plus élevées et des valeurs les plus basses.
Désormais, les données d'attribut sont mesurées à différentes échelles. Par conséquent, nous avons différents types de donnéesd'attribut. Le premier que nous avons fait est les données nominales qui décrivent les différents types de donnéesou de catégories de données. Ainsi, des exemples de ce type de données pourraient être vos données d'utilisation du sol ou les données sontde telles données de sol, donc où en vous donnez les catégories d'utilisation du sol ou les catégories de sol. Les donnéessuivantes que nous traitons sont les données ordinales. Il s'agit donc de différencier les données par une relation de classement.
Donc, nous pouvons dire que nous avons un ensemble de données, donc nous pouvons quantifier l'intensité comme dans ce cas particuliernous parlons de l'érosion du sol. Donc, si l'érosion est sévère oumodérée, nous pouvons aussi parler de la matrice de proximité comme elle est très proche ou très proche ou je veux dire que nous pouvonsavoir différents types de mesures et classer les relations. Maintenant, les données d'intervalle sont les intervallesentre les différentes valeurs ont des intervalles connus, comme supposons que nous pouvons catégoriser les données de températureen différents groupes et que nous pouvons avoir un groupe où il est possible d'avoir une température de donnéesfroide normale ou confortable et des températures plus chaudes.
Ainsi, nous pouvons catégoriser les données et ces données sont connues sous le nom de données d'intervalle. Le dernier que nousutilise souvent pour la modélisation des données dans le SIG est le rapport des données et c'est l'outil le plus puissant qui
que nous avons. Ainsi, nous pouvons utiliser à la fois le type entier de vos données numériques ou les données de type à virgule flottante lorsque nousavec des ensembles de données de ratio. Donc, je veux dire que c'est le rapport fondamentalement. Par conséquent, pour un exemple, nous pouvons parler de la densité de population selon des termes différents, qui est un exemple de données de rapport.
 
Maintenant, il existe quatre types de conception de base de données chaque fois que nous prenons des tâches SIG, nous pouvons créerdifférents types de base de données en fonction de la taille de la base de données. Par conséquent, si la base de données est petite, nous pouvons créer une nomenclature de fichier à plat où, dans nous, un fichier unique et les données sont organisés dansun tableau à deux dimensions d'éléments de données. La prochaine est les données hiérarchiques dans lesquelles les donnéespeuvent être organisées dans une structure arborescente, ce qui implique qu'il existe un seul parent pour chaque enregistrement.
Le type de données suivant est le type de données réseau. Il s'agit donc d'une modification, d'une modification supplémentaire del'ensemble de données hiérarchique et d'un grand nombre de relations dans une structure arborescine dans un
structure hiérarchique. Ainsi, cette structure de données ou ce type de conception de base de données permet àplusieurs parents. Ainsi, si vous avez des noeuds terminaux, vous pouvez avoir plusieurs parents sur ces noeuds terminaux.
Le dernier type de la conception de base de données est la base de données relationnelle qui est la donnée la plus puissanteJe veux dire la conception de la base de données lorsque vous avez de très gros ensembles de données. Par conséquent, nous avons généralement utilisé ou relationnel un système de gestion de base de donnéespour modéliser toutes les données pour effectuer la conception de l'ensemble des ensembles de données. Donc, je veux dire qu'il est basé sur la logique de prédicat et qu'il est basé sur la théorie des ensembles. Par conséquent, nous avons le nom de colonnesde relation qui sont appelées attributs et domaine et ce domaine est l'ensemble de valeursdes attributs.
 
Ainsi, nous pouvons disposer de systèmes de gestion de base de données qui fonctionnent à l'arrière-plan lorsqu'il gèrevos données SIG. Ainsi, il construit et gère la base de données SIG. Par conséquent, ces outilsDBMS fournissent des solutions pour l'entrée de données pour la recherche et l'extraction de données
la gestion et la génération de sorties à partir de vos requêtes, votre SIG peut interagir de mes donnéesà partir de sources multiples.
Donc, je veux dire que nous pouvons nous connecter à des bases de données éloignées et que ce SIG a la capacité d'accéder à de telles bases de données, je veux dire plusieurs bases de données. Donc, pour que je veux dire connecter ces multiples bases de données, nousbesoin d'avoir un champ unique qui est connu sous le nom de clés. Ainsi, nous avons une base de données relationnelle où dans, nous avons la collection de tables et elles seraient connectées les unes aux autres par un ID de fonction queest appelé clés et que les relations y sont intégrées.
Il existe différents types de clés. Tout d'abord, nous parlons des clés primaires que je veux dire, ce sont les attributsdont les valeurs sont uniques et peuvent être identifiées comme un enregistrement dans une table. Nous avons égalementune clé externe qui est un ou plusieurs attributs qui font référence à la clé primaire dans une autre table,une autre table de référence dans laquelle d'autres fichiers sont disponibles.
Nous avons également parlé de l'objet BLOB qui est l'objet binaire de grande taille qui stocke le bloc de donnéesénorme que je veux dire par exemple, il peut s'agir des coordonnées de la moyenne des points ou des lignesque je veux dire pour moi en général, nous stockons les géométries de la fonction en tant que fichiers de blocs. Par conséquent, il peut s'agir d'imagesou de données multimédia, et ces fichiers peuvent généralement stocker ces coordonnéesen tant que nombres binaires.
 
Les types de relations que nous avons dans le système de gestion de base de données peuvent être deles quatre types. La première est la relation univoque. Ainsi, chaque enregistrement de la table estlié à un enregistrement unique et à un enregistrement unique dans une autre table. Par conséquent, si nous avons deux tablesil s'agit d'une relation univoque, je veux dire que vous ne voyez pas de connexions multiples dans ce type de relations.
(Référez-vous à l'heure de la diapositive: 29:27)
La suivante, c'est la relation d'un à plusieurs. Dans cet enregistrement, la table est associée àde nombreux enregistrements dans une autre table. Vous pouvez donc voir pour chacun de ces enregistrements particuliers qu'ils sontassociés à plusieurs enregistrements dans une autre table.
 
Maintenant, il peut y avoir une relation de plusieurs à un. Dans ce nombre d'enregistrements de la table, je veux dire que votre table d'attributspeut être associée à un enregistrement dans une autre table. Par conséquent, dans ce cas, vous disposez de la table attribuable à, de la table SIG et vous pouvez disposer d'une autre base de données dans laquelle vous voyez qu'il existe plusieurs connexionsde votre base de données d'entrée vers une autre base de données.
 
La prochaine est de nombreuses relations dans lesquelles de nombreux enregistrements d'une table seraient associésà de nombreux enregistrements dans une autre table. Donc, c'est comme ça que ces deux tables sont. Ils auraient leurs identificateursou les clés dont nous avons parlé. Par conséquent, je veux dire qu'ils seraient liés à chaquedans une relation de plusieurs à plusieurs.
(Référez-vous à l'heure de la diapositive: 30:34)
.
Maintenant, en parlant du système de gestion de base de données, nous pouvons joindre les données d'attribut. Je veux dire que nous pouvonsfaire une jointure non spatiale de la table d'attributs. Donc si nous avons plusieurs tables d'attributs, dans ce casvous pouvez voir que nous avons les tables de population pour différents états de l'Inde dans lesquels nous avons la population, nous avons le mâle et la population féminine, nous avons la différence entre le mâleet la femelle et le sex-ratio dans la première table qui a une clé primaire et dans la tablesuivante, nous avons la population totale qui est urbaine et la population totale qui est rurale que nousavons la zone ainsi que la densité et elle a une clé externe.
Ainsi, dans la diapositive précédente, nous avions parlé de la clé primaire et de la clé étrangère. Ainsi, vouspouvez voir comment ils sont situés et qu'ils seraient liés ou dans n'importe quelle opération de recherche ou de recherche ou que le traitementsupplémentaire de ces deux clés serait lié pour une jointure non spatiale. Ainsi, nouspouvons voir comment nous pouvons faire une jointure non spatiale.
 
Pour fusionner les données d'attribut, il existe peu d'options disponibles dans les logiciels SIG.Ainsi, la plupart de ces packages ont ces opérations. Ainsi, la première est l'opération de jointure oùdans les deux tables à l'aide des clés, les clés communes sont jointes et les colonnes sont ajoutéesd'une table à une autre. Ainsi, pour le dans la table d'entrée, je veux dire qu'il deviendraitune table étendue, où dans toutes les zones seraient ajoutées.
Le suivant, la prochaine façon de fusionner les données d'attribut est l'opérateur de relations, oùconnecte temporairement deux tables à l'aide des clés communes ou des zones que nous avons vues sont des outils communs, les deux tables. Maintenant, la troisième est la jointure spatiale qui utilise une relation spatialepour joindre les deux ensembles de données des caractéristiques spatiales ainsi que leurs données d'attributs. Donc,on peut voir un exemple de données spatiales, une jointure spatiale.
Ainsi, dans notre diapositive précédente, nous avons vu les données relatives aux statistiques démographiques des différents étatsde l'Inde. Donc, vous pouvez voir ici une opération de jointure spatiale a été fait dans le graphique en pi bleu,pi vous pouvez voir que c'est la population et que l'orange vous donne la fraction de la population urbainedans les différents états. Ainsi, vous pouvez identifier les états dans lesquels, dans laquelle la population urbaineest la plus élevée, ces deux tables se rejoignent à l'aide d'une jointure spatialeet nous pouvons voir la sortie ici.
 
Ainsi, la récapitulation de ce que nous avons couvert aujourd'hui, nous avons parlé de Statistiques descriptives unidimensionnelles, où dans nous avons parlé des tendances centrales de la moyenne, de la médianeet du mode pour les données univariées qui ne possèdent qu'une seule colonne d'attribut. Nous avons ensuite parlé de l'analyse de données multivariées, nous avons parlé de statistiques inférentielles, nous avons parlé des différents types de données d'attributs, puis nous avons enfin parlé de la gestion des données.
Nous avons parlé de la façon dont nous pouvons faire l'entrée des données et quels sont les différents types de données. Dansque nous avons parlé de la conception de la base de données, nous avons parlé de la base de données relationnelle, des opérations de données. Donc, merci pour l'audition de votre patient jusqu'à ce que nous nous réunissons à nouveau lors de la prochaine conférence.
Merci beaucoup.

Notification
You have received a new notification
Click here to view them all