Hadoop konusunda araştırma yapıyorum ama bu 3 tane kavram hakkında düzgün bir bilgi bulamıyorum.
Hive, spark ve pig nedir? Ne için kullanılır? Hangisini kullanmalıyım?
comments
1 references
// Comments are closed.
Hive hadoop üzerinde ilişkisel veri tabanı kullanmayı sağlıyor, dolayısıyla sql kullanımı olanağı sunuyor.
Pig ise kendine ait bir scripting dili vererek verileri sorgulama olanağı veriyor.
Spark ayrı bir kategoride. Hadoop olsun olmasın çalışabiliyor. Sorgulama yapmaya izin veriyor. Sanal tablolar oluşturulabiliyor.
Araştırmalar ve yaptığımız örneklerin sonunda hadoop daha az çekici gelmeye başladı. Ayrıca google da dahil yavaştan hadoop’u bırakmaya başladılar. Şu an spark daha revaşta görünüyor.