Skip to main content

Processing Big Data with Hadoop in Azure HDInsight

Enrollment is Closed

Сведения о курсе

Все большее число организаций начинает всерьез заниматься анализом больших данных. Этот курс научит вас, как использовать технологии Hadoop в Microsoft Azure HDInsight, чтобы построить решения по пакетной обработке данных, которые позволят произвести очистку и преобразование данных для последующего анализа. В ходе этого пятинедельного курса вы узнаете, как использовать такие технологии, как Hive, Pig, Oozie и Sqoop с Hadoop в HDInsight, а также научитесь работать с кластерами HDInsight с клиентских компьютеров на Windows, Linux и Mac.

ПРИМЕЧАНИЕ. Чтобы выполнить практические работы, входящие в этот курс, вам потребуются подписка на Azure и клиентский компьютер, на котором установлены Windows, Linux или Mac OS X. Вы можете оформить бесплатную пробную подписку на Azure (для этого требуется действующая кредитная карта, но с вас не возьмут денег за услуги Azure). Учтите, что пробная подписка доступна не во всех регионах. Однако пройти курс и получить сертификат можно без выполнения практических работ.

Что вы узнаете

В этом курсе вы узнаете, как:

  • Инициализировать кластер HDInsight.
  • Подключиться к кластеру HDInsight, загрузить данные и выполнять задания MapReduce.
  • Использовать Hive для хранения и обработки данных.
  • Обрабатывать данные с помощью Pig.
  • Использовать настраиваемые пользователем функции custom Python из Hive и Pig.
  • Определять и запускать рабочие процессы для обработки данных с помощью Oozie.
  • Перемещать данные между HDInsight и базами данных с помощью Sqoop.

Тренер:

Course Staff Image #1

Грэм Малкольм (Graeme Malcolm)

Грэм, по его словам, «уже с незапамятных времен» является преподавателем, консультантом и автором публикаций, специализирующимся на SQL Server и на платформе данных Microsoft. Он обладает статусом Microsoft Certified Solutions Expert по платформе данных и системе бизнес-аналитики SQL Server Data Platform. Проработав долгие годы с Microsoft в качестве партнера и поставщика, теперь он входит в команду Microsoft Learning Experiences в качестве старшего разработчика контента. В этой команде он планирует и создает контент для разработчиков и профессионалов по работе с данными, которые стремятся извлечь максимальную пользу из технологий Microsoft.

Classes Start
Classes End
Estimated Effort
15-20 total hours