Loading
Nota de Estudos
Study Reminders
Support
Text Version

Opções de Customização de Base

Set your study reminders

We will email you at these times to remind you to study.
  • Monday

    -

    7am

    +

    Tuesday

    -

    7am

    +

    Wednesday

    -

    7am

    +

    Thursday

    -

    7am

    +

    Friday

    -

    7am

    +

    Saturday

    -

    7am

    +

    Sunday

    -

    7am

    +

Opções de Customização de Base

00:00 Speaker 1: Olá, todos, e bem-vindos à Parte 2 da Seção 3 de nossa Visualização de Dados com série de tutorial Python e Matplotlib. Nesta parte, o que vamos estar falando nesta seção são muitas das opções de customização que podemos fazer com o Matplotlib. Mas antes precisamos ter um dataset decente. Assim poderíamos passar e poderíamos criar manualmente esse dataset. Isso seria meio bobo, especialmente quando há abundantes de datasets que podemos entrar na internet. Por isso, o tipo de dataset que eu gostaria que usássemos são ações. Por isso, com dados de estoque, ele representa um ótimo conjunto de dados tutorial por bastante algumas razões na verdade. Em primeiro lugar, os dados de ações tendem a vir com várias séries. Então o que eu quero dizer com isso é que tem vários tipos de dados, por isso muitas vezes você vai ter o eixo x serão datas, então esse é um aspecto interessante, mas também você terá dados de precificação, e às vezes os dados de precificação serão licitados / perguntarão se você está pagando muito dinheiro pelos seus dados de qualquer maneira, ou você pode obter dados de fechamento de alta e de forma automática, e assim é automaticamente quatro linhas. Falaremos sobre o que é open-high-low-close é quando chegarmos a ele.

01:12 S1: E então também você pode obter dados de volume que é quantas empresas foram negociadas nesse período de tempo ou quantas ações dessa empresa foram negociadas nesse período de tempo. Então com isso, é outro dataset. E o volume é uma escala completamente diferente do preço é, por isso permite-nos cobrir muita customização, além disso, também podemos fazer vários tipos de transformações nos dados. Assim, podemos aplicar as médias móveis, ou o que for, e traçar aquelas também. Por isso, permite-nos meio a trabalhar com muitas variações de datasets. E aí também, como eu estava dizendo antes, porque é uma série temporal, estamos trabalhando com datas e coisas do tipo, então tramando datas, datas não são números, então seu gráfico não entende automaticamente o que é uma data dela. Então o que temos que fazer é ter que geralmente converter os dados que temos em alguma espécie de formato de data que seja aceitável pelo nosso módulo.

02:03 S1: Então Matplotlib tem suas próprias datas de mpl que ela gosta. E por exemplo, outro módulo de charting você pode encontrar-se usando pela estrada, talvez, seria como uma espécie de módulo de plotagem JavaScript. Assim, aquele que vem à minha mente seria algo como Highgráficos, que leva dados na forma de Unix vezes 1000, isso é como o tempo do JavaScript. Então você precisa ser capaz de estar confortável com estampas de data de conversão para Unix e Unix para datar estampas, e todos os tipos de formatos como esse. Por isso, trabalhar com dados de ações é apenas muito útil, então é isso que vamos seguir adiante e fazer. Então primeiro vamos fazer o nosso proverbial 'deletar tudo', exceto para matplotlib.pyplot. E aparentemente eu perdi meu mouse. Lá está. E assim, vamos deletar tudo até este ponto, e agora vamos fazer, vamos em frente e importamos mais uma coisa da Matplotlib, então importe matplotlib.datas como mdatas. Novamente, a maioria das pessoas que usam o matplotlib.tâmaras abreviam para mencontros, então nós só vamos continuar seguindo esse padrão.

03:06 S1: Então também estamos ... Podemos ou não tocar em Matplotlib datas neste tutorial específico agora mesmo, mas ele será usado nesta seção. A seguir vamos seguir em frente e importar url lib porque vamos estar acessando a Internet. E aí nós vamos importar NumPy como NP, porque vamos usar o NumPy para fazer algumas de nossas crunching básicas e coisas do tipo. Então como eu estava dizendo antes, o NumPy se torna bem integral, bem rápido, a qualquer hora que você estiver trabalhando com números de dados. Então, se você não tem NumPy, novamente, você faz pip install NumPy, sem problemas.

03:40 S1: Então primeiro o que queremos seguir adiante e fazer é precisamos de algum tipo de função que vai agarrar os dados, e vamos seguir em frente e usar a API de Finanças do Yahoo. Se você não está familiarado com isso está totalmente bem. Não há autorização ou autenticação que vá até lá. É informação gratuita, então você não precisa ter uma conta com o Yahoo ou qualquer coisa assim. Por isso, para começar, vamos em frente e vamos definir, e vamos chamar isso de 'graph_data,' e aí nós vamos ter um parâmetro que nós passamos, e isso vai ser estoque. Então, o que isso vai ser é qualquer que seja o estoque que passarmos como esse parâmetro, é o que vai ser puxado e grafado. Então para nos ajudar a saber que empresa estamos fazendo, nós vamos seguir em frente e imprimir aquela empresa, então vamos imprimir, e vamos fazer 'puxando atualmente', aí vamos fazer, comma, estoque. Então, para apenas dizer, atualmente puxando, e aí vamos fazer um colão lá e vai imprimir o ticker que estamos puxando. Por isso, se você não está familiari ... Os estoques são identificados por seus ticários. Por isso, por exemplo, a Apple, empresa que vende celulares e computadores e tal, seu ticker ... O nome deles é A-P-P-L-E, Apple Incorporated, e então você tem o seu ticker é AAPL. Ou como outro um seria como a Tesla com seus carros elétricos, eles são TSLA, então só entender isso. Você sempre pode ir para o Google e digitar o nome da empresa e você pode descobrir o ticker se você já não sabe disso.

05:05 S1: Então, de qualquer maneira, puxaremos isso e agora vamos escrever a URL. Então esta será a URL que ... E nós chamaremos esta URL igual ... E esta será a URL para aquele ticker específico da API de Finanças do Yahoo. Então nós vamos colocar isso em uma string, e será ' http: // api.finance.yahoo.com/instrument/1.0/ + + '' e então isso aqui dentro será o estoque, então este é realmente o ticker. Então, atualmente puxando, isso vai ser ticker, este é o ticker para esse estoque, este é o ticker. Assim, este pode estar na teoria 'AAPL/chartdata; quote' porque é uma cotação de preço, e então podemos especificar o intervalo aqui. Assim, alcance será igual ao que quisermos e só vamos fazer 10 anos por enquanto. Vamos jogar com intervalos à medida que vamos. As APIs de Finanças do Yahoo alteram suas representações de data.

06:25 S1: Então, se você fizer realmente curto prazo como um dia ou três dias, você obterá estampas de tempo que são o tempo UNIX. E se você fizer prazos mais longos, acho que qualquer coisa depois de como 10 dias, será o seu ... 10 dias e mais, será representado em estampas de datas que você pode olhar e você as leria. Então, de qualquer forma, nós vamos lidar com ambos ou lidar com ambos para que você soubesse lidar com eles. Mas por enquanto começaremos com 10 anos e depois só faremos /CSV e fechamos nossa cotação lá. Então, em teoria, vamos em frente e vamos apenas imprimir a URL. Ok, então nós vamos descer aqui e então, vamos dizer como estoque aqui igual e então vamos dizer entrada e então estoque como este 'stock2plot:' Adiciona um espaço porque caso contrário se você digitar ele vai gostar do tipo logo em cima dele.

07:19 S1: Então stock2plot, então isso permitirá que o usuário goste de tipo algo em. Então entrada só nos permite escrever no console basicamente. E então vamos em frente e rodar graf_dados para o que quer que seja esse estoque. Então, só vamos dizer estoque. Passamos por estoque aqui que também é chamado de estoque, estoque e ele constrói essa URL pelo menos. E aí nós só vamos imprimir a URL, e então vamos visitá-la manualmente para olhar para ele. Então, vamos em frente e vamos salvar e correr isso. Então, up deve estourar o seu cônsul por aqui. Deixe-me arrasar por cima. Não pode parecer tocá-lo agora mesmo. Então, mexa por aqui e vamos dizer que queremos fazer TESLA. Portanto, esta seria a URL que ela nos alimenta. Então vamos copiar essa URL e vamos abri-la em um navegador. Então, quando a visitamos em um navegador, é isso que conseguimos. É um pequeno preço pequeno então deixe-me apenas dar zoom em um pouco para vocês. E assim são esses os dados. Então isso foi com o CSV de 10 ano. E assim você pode ver aqui que há algumas informações iniciais aqui que são basicamente inúteis para nós. Mas aí se rolarmos um pouco, isso começa a parecer com alguns dados bem normalizados. Então, nós podemos olhar para isso visualmente e meio que dar uma ganada no que isto é.

[chuckle]

08:33 S1: Então vamos ver. Nós vamos para cá. Então você tem let's say this line aqui. Este é o selo de data e podemos classificar de deduzir. Pode ser meio difícil de ver visualmente mas sabemos que este é o ano. Então, 2011, o mês, então 10 so outubro e depois o dia, então a terceira. Então, 3 de outubro de 2011, e depois temos a informação de precificação. E eles ordenam uma espécie de funky. Eles fazem close-high-low-open. E então finalmente o ... Então, isso é perto, este é o alto para o dia inteiro, este é o baixo para o dia inteiro, e este é o aberto. Então, quando os preços daquele dia se abriram, no mercado aberto, qual era o preço da empresa? Era 24,95. Para aquele dia inteiro, qual foi o preço mais alto? 27,6 e então você tem algumas outras informações lá. E então este é o volume então é assim que muitas ações dessa empresa foram negociadas. Isso na verdade é bastante um pouco de volatilidade de 22 para 27. Tipo, oh, meu gosh. [chuckle] Que foi ... Esse é um estoque bastante volátil como eu suponho inicialmente. Oh, minha bondade. Eles tinham bastante poucos ... Como esses intervalos são maciços para os estoques de comp. Como geralmente você tem como 1% em um dia como o mais. Enfim, assim são nossos dados e vamos continuar trabalhando com isso nos próximos tutoriais estaremos falando como analisar todos esses dados para fora e atribui-los a variáveis, e então em breve estaremos grafando-o e tudo isso. Então, fique atento para isso.
00:00 Speaker 1: Olá todo mundo, e bem-vindos à quarta parte da Seção Três, que é visualização de dados em Python com matplotlib. Nesta parte, o que nós vamos estar falando é criar essa função de conversão para nossas informações de dados que estamos puxando offline. Assim como eu estava dizendo às vezes a conversão de dados de data para que possamos realmente trá-los em um gráfico pode ser confuso mas uma vez que você se acostuma a manuseio para dados de data ela não se torna mais tão tediosa. Então, de qualquer maneira, na conversão nós especificamos uma função de conversão mas na verdade não temos essa função. Então nós vamos seguir adiante e construir essa função agora. Então vamos fazer uma nova função aqui e vamos chamá-la da mesma coisa obviamente, então bytes pdate2num e então essa função leva um formato e depois é preciso codificação. E a codificação vai ser TF8 porque essa é a codificação de dados da internet.

00:56 S1: Então: O que vamos fazer agora é vamos começar primeiro com um string_converter e o conversor de cordas é o equivalente a datas M que normalmente era assim era como ele costumava funcionar e foi ótimo mas ainda não funciona totalmente em três so iguais M dates.strpdate2num, portanto, faixa data para número e depois formato, fmt. Então no passado, você costumava ser capaz de dizer que seu conversor era basicamente igual a este, certo? Como isso. Assim, poderíamos copiar isso e colar. E essa base ... Isso costumava funcionar em Python 2 mas não funcionará em três por causa desse material de informação de bytes. Então, o conversor de cordas é igual a isso mas então nós temos que fazer mais algumas coisas. Então vamos fazer um ... Nós vamos criar essa pequena função de trial e ela será chamada de conversor de bytes e então passaremos em B aqui e então vamos dizer S=b.decode usando o formato de codificação lá. Então, nós estamos decodificando UTF8 então vamos devolver o str_converter S então nós retornamos os bytes_ ... Ou bytes, nós não colocamos sublinhado. Vamos adicionar um sublinhado aqui. Então, sublinhado e sublinhado.

02:34 S1: Então, isso deve converter os dados para o formato que queremos que esteja em formato de datas M. Por isso, descemos aqui e vamos em frente e só imprimir data. Então depois dessa longa fila aqui, vamos imprimir data e ver se realmente funcionou da maneira que nós queríamos. Assim, vamos apenas economizar e correr bem rápido. Nós continuaremos com a TSLA. Ok, com certeza nós planejamos essas datas de M. Ok, então essas são suas datas e tudo é ótimo. Então, mesmo que ... Sim, novamente essas datas significam nada provavelmente para você mas significa muito para matplotlib. Então, são os números que queremos ver, algo no ,000s de 700 por enquanto. Então, feche isso. Legal. Por isso, nossa conversão funcionou mesmo que pode não parecer a melhor mas agora estamos prontos para realmente traçar algumas informações. Então o que nós podemos fazer agora é em vez de namorar lá, vamos apenas deletar isso. E então agora, nós podemos fazer plt.plot_date, então estamos notificando matplotlib que estamos prestes a passar datas para ele. A data e depois o close P, então nós faremos um plt.show rapidinho. Plt.show.

03:47 S1: Agora com o matplotlib, quando fazemos uma data de trama ele não inadimplência na trama de linha. Ele inadimplente a uma trama dispersa então deixe-me mostrar, não um espalhado, ele padronizado para apenas um marcador de ponto embora assim se fizermos TSLA novamente, o gráfico que vai vir até aqui. Certo, então você vê os pequenos marcadores são esses pequenos dotes? Ok, então nós podemos lidar para isso fechando aqui e adicionar outro argumento aqui e esse é só o tipo de linha, então basta fazer um traço, certo? Por isso, o traço é duas chaves sobre a sua chave de backspace. Agora vamos correr isso mais uma vez. Ah, eu estava tipo " Onde está o gráfico? Não é pipocar. " TSLA e agora temos, na verdade, um gráfico de linhas. Agora, deixe-me fazer um pouco maior aqui. Assim, podemos ver que temos julho, Jan; basicamente Jan e julho todo o caminho até mas o que acontece, o que é bem legal sobre a formatação da data agora é que você pode ver que é só o mês e o ano, e realmente não muitos meses, é só o Jan e julho, e julho está só na metade do caminho. Então realmente estes são apenas a cada seis meses que estamos recebendo um marcador lá.

04:55 S1: Mas se nós zoarmos para um ponto específico, você verá que, "Ah, nós ficamos mais meses." Certo? Nós chegamos fevereiro e abril mas quando podemos dar zoom em mais alguns, e agora temos vários dias dentro de fevereiro. E poderíamos continuar o zoom e você pode ver agora temos seis, sete, oito, nove, 10, 11, 12 e nós não temos dados de granularidade realmente altos aqui. Mas na verdade poderíamos continuar o zoom e agora você pode ver esses são timestamps nessa data, ok? Então, nós não temos dados para esse tempo mas podemos em teoria apenas continuar zoom e ficar realmente, realmente, realmente, muito perto. [chuckle] Enfim, ok, então isso funcionou. Então agora temos o nosso conjunto de dados, nós conseguimos um gráfico realmente simples. Nós não temos nossos títulos e nossos rótulos e tudo isso ainda. Mas o que nós vamos estar fazendo nesta série é personalizar esse gráfico para incluir todos os tipos de customizações incríveis, cores, opções e tudo isso de bom. Então, isso deve ser bem excitante e por sorte nós não estaremos realmente fazendo muita reescrita de código, apenas estaremos adicionando em cima de basicamente este gráfico. Portanto, nem tanto esse proverbial delegue desta vez. Então de qualquer maneira, série bem legal ou seção vindo seu caminho em breve. Então, fique atento para isso e obrigado por assistir.