1)hadoop ודומותיה הן סיפריות לכתיבת קוד מבוזר, מבוסס framework שנשען על רעיון ה- Map-Reduce שפותח בגוגל(כמדומני), שמשתמש בכל מיני הנחות לכתיבת קוד.
הרעיון מזכיר את map/fold משפות פונק' טהורות כמו lisp ו-scheme.
2)המימוש של hadoop הוא ב-java, וכדי להתממשק אליו, או לממש פונקציונאליות מסוימת - כותבים ב-java.
3)hadoop הוא לא DB!!
4)מעל ה-hadoop יש מוצרי high-level כמו HBASE, Cassandra,HIVE שהם בעצמם כן בסיסי נתונים(או מחסן נתונים אם מדברים על HIVE), יש גם ספריות אחרות שנועדו ל-Data mining ו-machine learning כמו mahout.לגבי mongoDB זה כבר DB אחר(עם הרחבות גיאומטריות), אישית לא יצא לי להשתמש או אפילו לראות קוד שמשתמש בו(לפחות כרגע).
כדי להתעסק עם התחום אתה צריך קצת להבין מאיפה הוא נובע, ולהבין מטרות מסויימות שלו - כמו ניתוח מידע רב, לבינה עסקית או בכלל, להבין אלגוריתמים בלמידת מכונה וכריית מידע.
לדעתי הכי קרוב למה שאתה צריך זה HBASE, שזה לא בדיוק DB רלציוני שאנחנו מכירים, או HIVE שמציעה מעין שפת SQL (לא יצא לי להשתמש בזה).
