[Spark] K8s로 spark cluster 구축하기

2024. 6. 5. 02:21·프로그래밍/Spark

관련 깃허브

https://github.com/bitnami/charts/tree/main/bitnami/spark

 

charts/bitnami/spark at main · bitnami/charts

Bitnami Helm Charts. Contribute to bitnami/charts development by creating an account on GitHub.

github.com

1.  Helm 다운로드 

helm install my-spark-release oci://registry-1.docker.io/bitnamicharts/spark

 

2.  상태 확인

helm status my-spark-release

 

3. 웹 ui 확인

# localhost:80로 ui 포트포워딩 
kubectl port-forward svc/my-spark-release-master-svc 8080:80

 

4.  Spark job Test

#컨테이너 접속
kubectl exec -it my-spark-release-master-0 -- /bin/bash  
#example 실행
spark-submit --master spark://my-spark-release-master-svc:7077 /opt/bitnami/spark/examples/src/main/python/pi.py

 

 

# 커스텀 Spark 이미지 적용하는 방법

# values.yaml 
image:
  registry: docker.io
  repository: your repo
  tag: your tag
  pullPolicy: IfNotPresent
  
#이미지 적용 
helm upgrade my-spark-release -f values.yaml

'프로그래밍 > Spark' 카테고리의 다른 글

[Spark] Cluster mode vs Client mode  (0) 2024.11.08
[Spark] MLlib 정리  (0) 2022.12.07
[Spark] 델타 레이크 구축  (0) 2022.12.06
[Spark] 데이터 베이스, 데이터 레이크 , 레이크 하우스  (0) 2022.12.03
[Spark] 스트리밍 성능 튜닝 시 고려할 점  (0) 2022.12.02
'프로그래밍/Spark' 카테고리의 다른 글
  • [Spark] Cluster mode vs Client mode
  • [Spark] MLlib 정리
  • [Spark] 델타 레이크 구축
  • [Spark] 데이터 베이스, 데이터 레이크 , 레이크 하우스
장경훈
장경훈
데이터 엔지니어가 되기 위해 공부하는중입니다.
  • 장경훈
    Jang's coding blog
    장경훈
  • 전체
    오늘
    어제
    • 분류 전체보기 (79)
      • 자격증 (2)
        • AWS-SAA (1)
        • CKA (1)
      • algorithm (26)
        • baekjoon 문제 (7)
        • 프로그래머스 문제 (16)
        • 알고리즘 개념 (3)
      • 프로그래밍 (36)
        • Kubernetes (1)
        • airflow (5)
        • python (3)
        • ELK (3)
        • Spark (14)
        • Scala (2)
        • git (0)
        • aws (4)
        • terraform (1)
        • Network (1)
        • Podman (2)
      • 개인프로젝트 (7)
        • twitter 실시간 데이터 프로젝트(ELK st.. (7)
      • 팀 프로젝트 (7)
        • PC 로그 이상탐지(2023한이음) (2)
        • 개인정보 비식별처리 (2023한이음) (2)
        • Data fabric (2023한이음) (2)
        • Capstone(Sejong) (1)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    티스토리챌린지
    2012번
    그리드
    오블완
    백준
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.6
장경훈
[Spark] K8s로 spark cluster 구축하기
상단으로

티스토리툴바