Em um mundo em que as organizações contam com a tomada de decisão rápida e informada, a analítica de big data existe para extrair insights significativos de enormes quantidades de informação. Ela desempenha um papel importante em todos os campos da saúde e da economia para a banca, assim como no governo; novas oportunidades e desafios continuam a surgir para lidar com quantidades massivas de dados. O Ecossistema de Hadoop Apache, com seus componentes de código aberto, é projetado para responder a essas necessidades: armazenar, processar, avaliar, analisar e minerar dados. Ao contrário dos sistemas tradicionais, o Hadoop manipula diversos tipos de cargas de trabalho que consistem em diferentes tipos de dados, com processamento paralelo massivo usando hardware padrão de mercado.
Hadoop armazena dados no sistema de arquivos distribuído Hadoop (HDFS), que foi projetado para rodar em hardware padrão. O HDFS é muito falha-tolerante, fornece acesso de alto rendimento aos dados do aplicativo e é adequado para aplicativos que possuem conjuntos de dados grandes. Este curso ilustra como diferentes tipos de dados podem ser armazenados no HDFS e como processá-los usando os vários componentes do ecossistema Hadoop. Frameworks de computação em cluster como o MapReduce têm sido amplamente adotados para análise de dados em larga escala. Os datasets distribuídos resilientes (RDDs) permitem reutilização de dados eficiente em uma ampla gama de aplicações. Os RDDs são tolerantes a falhas, estruturas de dados paralelas que permitem que os usuários persistam explicitamente os resultados intermediários na memória, controle seu particionamento para otimizar o posicionamento de dados, e manipulá-los usando um rico conjunto de operadores.
Você está interessado em big data? Você gostaria de mais sua compreensão do software Hadoop? Este curso é para desenvolvedores de casa de banco de dados e dataware, grandes desenvolvedores de dados e arquitetos, cientistas de dados, analistas e qualquer pessoal técnico interessado em aprender e explorar os recursos de big data e suas ferramentas. Com lições abrangentes guiando você passo-a-passo e teoria para o backup, o curso segue com sessões hands-on para obter experiência prática em Sqoop, Hive, Spark, Flume, Apache Pig e Cloudera. Por isso, se você está procurando aumentar o seu conhecimento sobre os recursos avançados do ecossistema Hadoop, inicie este curso online gratuito hoje!
In This Free Course, You Will Learn How To
View All Learning Outcomes View Less All Alison courses are free to enrol study and complete. To successfully complete this course and become an Alison Graduate, you need to achieve 80% or higher in each course assessment. Once you have completed this course, you have the option to acquire an official , which is a great way to share your achievement with the world.
Your Alison is:
- Ideal for sharing with potential employers
- Great for your CV, professional social media profiles and job applications.
- An indication of your commitment to continuously learn, upskill & achieve high results.
- An incentive for you to continue empowering yourself through lifelong learning.
Alison offers 3 types of s for completed courses:
- Digital : a downloadable in PDF format immediately available to you when you complete your purchase.
- : a physical version of your officially branded and security-marked
- Framed : a physical version of your officially branded and security marked in a stylish frame.
All s are available to purchase through the Alison Shop. For more information on purchasing Alison , please visit our FAQs. If you decide not to purchase your Alison , you can still demonstrate your achievement by sharing your Learner Record or Learner Achievement Verification, both of which are accessible from your Account Settings. For more details on our pricing, please visit our Pricing Page