2015년 책이다. 자리 이동 하면서 정리차 목차만 다시 봤다.
일단 다 해본 것이라 특이사항은 없다.
물론 이 책은 RDD부터 고전적인 어프로치를 하고있지만,
스파크 진영의 흐름은 RDD는 지양하라는 것이고 DF를 지향하라는 것이다.
더욱 추상화 시대로 이용하라는 느낌인데, 사실 spark 로 코딩하려는 사람들은 더 저수준의 조작을 원한다.
Mlib도 이제 RDD를 수준의 ML은 쓰지 않을 것이다.
스파크는 판갈이가 계속해서 일어났지만 초심자는 지금 이 책으로 시작해도 좋다.
단, 3일안에 한 번 볼 것이 아니라면 요즘 책이 좋겠다.