Kas yra Apache Hadoop?

„Apache Hadoop“ yra „Apache Software Foundation“ sukurtų didelių duomenų algoritmų, paskirstyto saugojimo ir paskirstytosios apdorojimo programinės įrangos pavadinimas. Jis skirtas didelės apimties duomenų paslaugų programoms palaikyti; automatiškai apdoroti aparatūros gedimus be paslaugos praradimo.

Hadoop naudoja platinamą failų sistemą, vadinamą HDFS, ir programinę įrangą didelių duomenų rinkinių, žinomų kaip MapReduce, apdorojimui. Ypač dideli failai yra suskirstyti į gabalus, paprastai 64 arba 128 MB. Programinė įranga dažniausiai parašyta „Java“, su kai kuriais žemesnio lygio kodais, parašytais C.

Apache serveris, Dideli duomenys, Paslauga, Programinės įrangos sąlygos