Apache Spark?Apache Spark는 대규모 데이터 처리를 위한 오픈 소스 분산 컴퓨팅 시스템입니다.용어 정리기본 개념RDD (Resilient Distributed Dataset): Spark의 기본 데이터 구조.DAG (Directed Acyclic Graph): 작업의 실행 계획을 나타냅니다.Partitioning: 데이터의 분할 방식.Transformation and Action: Spark에서의 주요 작업 유형들.Spark ArchitectureDriver와 Executor의 역할과 동작 방식Spark Application, Jobs, Stages, Tasks의 관계와 흐름Spark APIsDataFrame & Dataset API: 선언적 데이터 처리를 위한 인터페이스Spark St..