Loading
Nota de Estudos
Study Reminders
Support
Text Version

Medição de Variáveis de Estudo

Set your study reminders

We will email you at these times to remind you to study.
  • Monday

    -

    7am

    +

    Tuesday

    -

    7am

    +

    Wednesday

    -

    7am

    +

    Thursday

    -

    7am

    +

    Friday

    -

    7am

    +

    Saturday

    -

    7am

    +

    Sunday

    -

    7am

    +

muitas vezes ouvimos afirmações como eu havedados de cem milpacientes leprosy tenho dados sobre mudança climática na cidade chilena tenho dados sobre acidentes de trânsito e assim por diante em todas essas afirmações há uma palavra dados nesta sessão vamos ver o que esses dados significam quais são os diferentes tipos de dados e como paraconverter esses dados em pedaços de informações podem ser amplamenteclassificados em dados qualitativos e quantitativos os dados qualitativos como o nome sugere nós não pode quantificá-los ele está em algum tipo de qualidade novamente este dado qualitativo poderia ser um dados nominais ou um dado ordinal os dados nominais os exemplos da cor dos olhos as diferentes regiões de uma cidade e assim por diante e os dados ordinais são os dados que podem ser dispostos em uma espécie de ordem como exemplos em todas as etapas da doença dados quantitativos novamente são de duas categorias um é um dado discreto que essencialmente é um número completo vários tamanhos família tamanho etc e o outro é um dado contínuo onde é uma medição contínua como altura e peso soestes são todos diferentes tipos de dados que requerem diferentes tipos de habilidade analíticaagora o nosso objetivo é obter algumas informações fora de dados um grande conjunto de dados é muito essencial mas ainda olhando para apenas os dados você não consegue obter qualquer informação então precisamos resumi-los uma das formas de resumir os dados é obter um valor de uma espécie de uma média não média você quer dizer que a primeira média que vem à nossa mente é a média que também é chamada de média aritmética esta é uma média aritmética esta é uma média mais usada e simplesmente é chamada significa quer dizer todos os valores observados chamamos isso como soma que é Sigma X I em uma notação matemática dee média não é nada além de dividir esta soma pelo número de observações que você usou em seus cálculos que é n a média da amostra é denotada por um X uma linha de barras em cima de X e a média da população é denotada por mu digamos ver um exemplo supor que há 10 pacientes grávidas que tinham visitado uma clínica ANC e que as idades são 26 31 25 e assim por diante e o que é um ser de idade dessas grávidas a média é que chega a somar todas as idades que chega a 216 há 10 observações so dividi-la por 10 é 260 por 10 que é igual a 26 dizemos a idade média das mulheres grávidas que visitaram a clínica NZ é de 26 anos agora um dos problemas com essa média média é de alguns valores extremas ou pequenos mesmo um ou dois se estiverem presentes em seus dados disseram que poderiainfluenciar na média porque você está adicionando todo e um grande valor se você teve toda a média se torna uma superestimação então para poder controlar isso ou para evitar isso nós temos um outro pode uma medida que é chamada mediana é literalmente o valor médio da distribuição ele divide a distribuição exatamente em duas metades que são 50% dos dados cairão em qualquer lado esta é uma utilização muito usada vamos medir especialmente quando você ter valores extremas vamos ver este exemplo suponhamos que você tenha um dado sobre a duração da estadia em hospitais de 11 pacientes a duração é de um dia dois dias e nove dias para dez pacientes e depois o décimo primeiro paciente são 77 dias de curso eu organizei esses dados em ordem crescente omediano é o valor do meio que é um sexto valor os valores se você conseguir n mais 2.1.2011 mais 112 dividido por 2 é 6 portanto o sexto valor é o valor de 6 que significa a mediana é 6 aqui enquanto que nós contamos quando você realmente computa a média para isso ele sai a ser onze ponto oito como poderia-se preferir ver 6 é mais apropriada medida de média neste caso em vez da média onze ponto oito se n é mesmo então você leva a média de dois valores médios agora há uma outra medida que é chamada de mais modo é o valor que ocorre com mais frequência no modo fato são as únicas estatísticas de localização que podemos utilizar para dados nominais que não são mensuráveis em uma curva de premie nós fazemos uso mais frequentemente em uma curva epidêmica com relação ao tempo olhamos para a classe do modelo e então isso dá uma ideia do período de incubação do patógenoo exemplo para um modo é a preferência de cor e a número de pessoas eram 354 pessoas elas preferem verde 852 preferem ello 310 preferem branco e 474 roxo certo so o número máximo de pessoas que eles preferem de ello e por isso a classe modelo é ello diz que você poderia preferir ver como no respeito de modo algum pode haver vários modos que não podem ser um modo em um sinal supor se todos os valores são 354 aqui então não há modo mais pode existir pode existir pode haver múltiplos em um conjunto de dados agora vimos modo mediano mediano são três boas medidas de resumir seus dados para obter um valor médio então não é suficiente você apenas prefere saber o valor médio digamos por exemplo você vai a uma piscina e nãosaiba nadar e você tem cinco pés sete polegadas e depois se o gerente da piscina diz que a profundidade média da piscina é de quatro pés e meio você se sente muito confortável e você pula e suponha que o lugar em que você pula é nove pés então sabe a coisa quevocê sente falta para perguntar é sim a média é de quatro pés e meio mas qual é a variabilidade que talvez você saiba onde é um raso como três pés e com profundidade como nove ou dez pés para que você precise bastante pergunta qual é a variabilidade uma das medidas que vem à nossa menteé o alcance a range é a diferença entre o mínimo e, em seguida, o valor máximo das observações uma vantagem deste medida é é muito rápido e fácil indicador de dispersão mas como eutinha dito sobre a média o intervalo também é influenciado por valores extremos e também consideramos apenas dois valores o primeiro e depois o último e no entre nós não estamos usando os dados em todos e isso é umagrande desvantagem de alcance há outro valor que é chamadointerquartil alcance este em grande medida cuide desses valores extremos no sentido dividimos os datasets emquatro trimestres e tentamos remover o primeiro trimestre e depois o último trimestre e considerar apenas o meio 50% dos valores e este intervalo interquartil é o q3 menos q1 e então uma grande vantagem disso é esse valor não é mais afetado por valores extremos mas novamente as desvantagens é ele cobre apenas o meio 50% dos valores e então o mesmo disse que um dias que tivemos para intervalo queusa vai precisar de valores e em entre valores não é feito uso de e essa é uma grande desvantagem desses valores e a outra medida de variabilidade é desvio médio de mim o que quer dizerpor exemplo a partir de sua dados conjuntos a cada ponto de dados tentamos subtrair a média e então tentamos tirar uma média desta média desvio que é chamado de desvio médio de significar um dos problemas com isso é se você preferir fazer com isso o que acontece éhá alguns valores que são menores que a média de alguns valores que são mais do que a média e se você fizer a somatória de todos estes você obtenha um valor 0 so quer dizer desvio de média é sempre zero a fim de que o que nós fazemos é nós sabemos o mesmo e então nós apenas tiramos a diferença e então tiramos a média isto chamado absoluto desvio absoluto e vantagens é baseado em todas as observações do grupo é fácil agarrar o significado de todo o procedimento mas o descenso um dia decisão você sabe a ciência da diferença do valor e o é matematicamente não é muito rigoroso usar esse valor assim para poder passar por cima que temos uma outra medida o que fazemos é fazemos a diferença de cada observações da média e em vez de ignorar o mesmo nós os quadramos o quadrado toma conta de até o menos e depois o mais tudo se torna mais e então tiramos uma média de que esse valor é chamado de variância e já que esta variância é que somos quadrados e então a medição também quadrada nós tiramos uma raiz quadrada no final e isso é chamado de desvio padrão o desvio padrãoapenas indicado como SD é a raiz quadrada da média dosdesvios quadrados das observações da média aritmética o quadrado do desvio padrão é a variância tão vantagem o seu desvio padrão é a medida mais importante da distribuição enquanto a variância é em unidade quadrada o desvio padrão é expresso nas mesmas unidades da medição e é adequado para posterior análise, portanto, desvio padrão juntamente com média aritmética é útil para descrevendo os dados e essas duas medidas são extensivamente utilizadas para tratamento adicional de seu conjunto de dados eu vou apresentar para você mais uma medida que é chamada de coeficiente de variação o objetivo desta medida suponha se você tiver umdiferentes grupos diferentes conjuntos de dados para comparar e então deseja-se comparar sua variabilidade relativa em diferentes grupos portanto o coeficiente de variação é o desvio padrão expresso como umpercentual de média aritmética porque o desvio-padrão por aritmética significa o que acontece são ambos das mesmas unidades de medições so a unidade de medida é cancelada para que o que você obtenha é um número puro e esse número expressa em termos de porcentagem que é multiplicada por 100 você consegue coeficiente de variação assim em resumo temos que escolher um centro ou dispersão valores apropriados o desvio médio e padrão são os valores centrais e de dispersão mais apropriados especialmente se não houver valores extremos se houver valores extremos existem métodos de ainda usar desvio médio e padrão usando algumas transformações de seus dados que requer um pouco de manipulação de seus dados de outra forma você vai em para gama mediana e interquartil e estas duas medidas median interquartile range do take cuidado de valores extremas o mais e alcance normalmente é usado para as variáveis quantitativas tempo distribuições em curva epidêmica a média e o desvio padrão comoEu disse são as medidas mais usadas de variabilidade e as estatísticas de alguém. Obrigado.