spark에서 kafka와 연동하기 위해서는 라이브러리가 필요하다.

라이브러리를 설치하기 위해서는 아래와 같이 패키지 옵션을 사용하면 자동으로 .ivy2 디렉토리에 라이브러리가 설치 된다.

org.apache.spark:spark-sql-kafka-{카프카버전}_{스칼라버전}:{스파크버전}

$ spark-shell --packages org.apache.spark:spark-sql-kafka-0-10_2.12:3.2.0

 

인터넷이 되는 환경이 아니라며 직접 maven으로 빌드하여 파일을 옮겨야 한다.

.ivy2, .m2디렉토리에 빌드된 파일을 넣어야 하는데 이 방법은 복잡하니 그냥 인터넷 되는 환경에서 spark-shell로 설치한 .ivy2 디렉토리를 옮기는것을 추천

'BIGDATA > SPARK' 카테고리의 다른 글

SPARK HA 구성  (0) 2022.03.01
spark --deploy-mode cluster 사용 시 pyspark 에러 발생  (0) 2022.01.26
spark 설치 (hive연동)  (0) 2021.11.27

+ Recent posts