📘 Jupyter Notebook 완벽 가이드: 설치부터 활용까지
1. Jupyter Notebook이란?
데이터 분석과 머신러닝을 공부하다 보면 가장 많이 접하는 툴이 바로 Jupyter Notebook입니다. Jupyter Notebook은 웹 브라우저에서 코드를 실행하고, 결과와 설명을 함께 기록할 수 있는 대화형 개발 환경으로, 데이터 과학자, 연구원, 프로그래머들에게 필수적인 도구로 자리 잡았습니다.
원래 Jupyter는 Julia, Python, R 세 가지 언어에서 시작된 프로젝트지만, 현재는 40개 이상의 언어를 지원합니다. 특히 Python 기반의 데이터 분석과 머신러닝에 최적화되어 있어, 전 세계적으로 가장 널리 쓰이는 분석 플랫폼이라 할 수 있습니다.
2. Jupyter Notebook의 특징
Jupyter Notebook이 사랑받는 이유는 단순히 코드를 실행하는 것에 그치지 않고, 문서와 시각화까지 지원하기 때문입니다. 주요 특징을 정리하면 다음과 같습니다.
- 셀(Cell) 단위 실행: 코드 블록 단위로 실행 가능
- Markdown 지원: 코드 외에도 설명, 이미지, 수식, 링크 작성 가능
- 시각화 친화적 환경: matplotlib, seaborn, plotly 등과 연동
- 웹 기반 접근성: 설치 없이 브라우저/클라우드에서 사용 가능
3. 설치 방법
- Anaconda 설치 (추천)
- pip install notebook 명령어 설치
- Google Colab / Kaggle Notebook 클라우드 기반 사용
4. 기본 구조
- 셀(Cell): 코드/마크다운/Raw
- 커널(Kernel): 코드 실행 엔진
- 파일 형식(.ipynb): 코드 + 결과 + 설명 저장
5. 실제 사용 예제
(1) Pandas를 활용한 데이터 분석
import pandas as pd
# 샘플 데이터 생성
data = {
'이름': ['철수', '영희', '민수', '지영', '현우'],
'국어': [90, 85, 70, 95, 100],
'영어': [80, 95, 60, 85, 90],
'수학': [75, 88, 95, 100, 70]
}
df = pd.DataFrame(data)
# 데이터 확인
print("데이터 미리보기:")
print(df.head())
# 평균 점수 계산
df['평균'] = df[['국어', '영어', '수학']].mean(axis=1)
print("\n학생별 평균 점수:")
print(df[['이름','평균']])
(2) Matplotlib으로 데이터 시각화
import matplotlib.pyplot as plt
# 학생별 평균 점수 시각화
plt.figure(figsize=(8,5))
plt.bar(df['이름'], df['평균'], color='skyblue')
plt.title("학생별 평균 점수")
plt.xlabel("학생")
plt.ylabel("평균 점수")
plt.ylim(0, 100)
plt.show()
(3) 간단한 머신러닝 예제 (Scikit-learn)
from sklearn.linear_model import LinearRegression
import numpy as np
# 공부 시간(x)과 시험 점수(y) 데이터
x = np.array([1, 2, 3, 4, 5]).reshape(-1,1)
y = np.array([40, 50, 60, 70, 80])
# 선형 회귀 모델 학습
model = LinearRegression()
model.fit(x, y)
# 예측
predict = model.predict([[6]])
print("공부 시간 6시간일 때 예상 점수:", predict[0])
6. 장점과 단점
✅ 장점: 직관적, 시각화 친화적, 문서화 가능
❌ 단점: 대규모 프로젝트 관리 어려움, 실행 순서 꼬임 문제, Git 충돌 발생 가능
7. 활용 팁
- 단축키 활용: Shift+Enter, A, B, M, Y
- nbextensions 확장 기능 설치
- Git 관리 시 .py 변환 권장
8. 마무리
Jupyter Notebook은 단순한 개발 환경을 넘어, 연구 노트와 보고서, 교육 교재, 실험 플랫폼 역할까지 수행할 수 있는 강력한 도구입니다. 이번 글에서는 설치 방법, 기본 구조, 그리고 실제 예제 코드까지 다뤘습니다. 이제 직접 실행해 보면서 데이터 분석, 시각화, 머신러닝까지 차근차근 익혀보시길 바랍니다.