본문 바로가기

IT/Spark

Spark install Command Line history


테스트는 Bash on Ubuntu on Windows 에서 진행했다.

참고링크 : https://blogs.msdn.microsoft.com/eva/?p=7633

설치

wget http://apache.mirror.cdnetworks.com/spark/spark-2.2.0/spark-2.2.0-bin-hadoop2.7.tgz
tar -xzvf spark-2.2.0-bin-hadoop2.7.tgz
ln -s spark-2.2.0-bin-hadoop2.7 spark
export SPARK_HOME=~/spark
export PATH=${SPARK_HOME}/bin:$PATH
cd ${SPARK_HOME}
ls
./bin/run-example JavaWordCount README.md
java
sudo apt-get install java
sudo add-apt-repository ppa:webupd8team/java
sudo apt-get update
sudo apt-get install oracle-java8-installer
java
echo $JAVA_HOME
which java

Word Count 테스트

./bin/run-example JavaWordCount README.md
./bin/run-example JavaWordCount README.md >test
cat test


쉘 구동

./bin/spark-shell


병렬처리 과정에서 실수가 발생하지 않도록 단일 스래드가 아닌 멀티스래드로 테스트를 해야 한다.


'IT > Spark' 카테고리의 다른 글

RDD 정리  (0) 2017.12.08
Practice using the results "jar" in Spark  (0) 2017.11.28
Reading before learning Spark  (0) 2017.11.22
spark develop environment (scala + intellij + sbt)  (0) 2017.11.22
spark shell test  (0) 2017.11.20