Hadoop Guida Italiano (Cos’è Hadoop) Articolo

Hadoop Guida Italiano

Stai cercando una Guida per Hadoop ? Bene leggi la nostra Hadoop Guida Italiano.

Hadoop Guida Italiano

Che cos’è Hadoop ?

Hadoop è un sistema distribuito per il salvataggio e l’interrogazione dei dati, scalabile e capace di gestire i guasti.
Hadoop è un Progetto open source sotto licenza Apache e fornisce due principali sistemi:
-Hadoop Distributed File System (HDFS): file system distribuito per salvare dati su un cluster di computer;
-MapReduce paradigma di programmazione realizzato per offrire scalabilità e tolleranza ai guasti;
Nota Bene: il programma scritto per Hadoop funziona a prescindere dalla dimensione del cluster.

Quali sono i vantaggi di Hadoop ?

-Dati strutturati e non (flessibilità);

-Scalabilità dei dati e della computazione;

-Analisi complessa dei dati;

HDFS significa Hadoop Distributed File System

Hadoop supporta anche:

  • Amazon S3 file system;
  • FTP file system;
  • HTTP e HTTPS file system in sola lettura.

Tra le applicazioni usate più spesso in un cluster Hadoop, troviamo:

Motori di esecuzione

  • Apache Spark, il motore di elaborazione che, nella maggior parte dei casi, è nettamente più veloce di MapReduce;
  • Pig (programma), una piattaforma di alto livello per creare programmi MapReduce;

Una console che vi consiglio di usare si chiama Apache Ambari, che aiuta ad amministrare un cluster Hadoop con maggiore semplicità;

Se l’articolo ti è piaciuto lascia un like nella nostra pagina di Facebook.

Pubblicato da newssat

Blogger Informatico.