스파크를 처음 접하는 입문자를 위한 안내서!2017년 현재, 스파크는 RDD보다도 더 뛰어난 기능으로 무장한 데이터셋을 추가로 도입해서 머신러닝, 그래프 알고리즘, 실시간 스트리밍 처리는 물론이고 하둡, R, 하이브(HIVE), 카프카(KAFKA), 아파치 제플린(ZEPPELIN) 등 빅데이터 분야의 기존 스타들과의 연동을...
[NAVER 제공]