카테고리 없음

Jupyter Notebook 완벽 가이드: 설치부터 활용까지

푸른바다23 2025. 9. 22. 16:36

📘 Jupyter Notebook 완벽 가이드: 설치부터 활용까지

1. Jupyter Notebook이란?

데이터 분석과 머신러닝을 공부하다 보면 가장 많이 접하는 툴이 바로 Jupyter Notebook입니다. Jupyter Notebook은 웹 브라우저에서 코드를 실행하고, 결과와 설명을 함께 기록할 수 있는 대화형 개발 환경으로, 데이터 과학자, 연구원, 프로그래머들에게 필수적인 도구로 자리 잡았습니다.

원래 Jupyter는 Julia, Python, R 세 가지 언어에서 시작된 프로젝트지만, 현재는 40개 이상의 언어를 지원합니다. 특히 Python 기반의 데이터 분석과 머신러닝에 최적화되어 있어, 전 세계적으로 가장 널리 쓰이는 분석 플랫폼이라 할 수 있습니다.

2. Jupyter Notebook의 특징

Jupyter Notebook이 사랑받는 이유는 단순히 코드를 실행하는 것에 그치지 않고, 문서와 시각화까지 지원하기 때문입니다. 주요 특징을 정리하면 다음과 같습니다.

  • 셀(Cell) 단위 실행: 코드 블록 단위로 실행 가능
  • Markdown 지원: 코드 외에도 설명, 이미지, 수식, 링크 작성 가능
  • 시각화 친화적 환경: matplotlib, seaborn, plotly 등과 연동
  • 웹 기반 접근성: 설치 없이 브라우저/클라우드에서 사용 가능

3. 설치 방법

- Anaconda 설치 (추천)
- pip install notebook 명령어 설치
- Google Colab / Kaggle Notebook 클라우드 기반 사용

4. 기본 구조

  • 셀(Cell): 코드/마크다운/Raw
  • 커널(Kernel): 코드 실행 엔진
  • 파일 형식(.ipynb): 코드 + 결과 + 설명 저장

5. 실제 사용 예제

(1) Pandas를 활용한 데이터 분석

import pandas as pd

# 샘플 데이터 생성
data = {
    '이름': ['철수', '영희', '민수', '지영', '현우'],
    '국어': [90, 85, 70, 95, 100],
    '영어': [80, 95, 60, 85, 90],
    '수학': [75, 88, 95, 100, 70]
}

df = pd.DataFrame(data)

# 데이터 확인
print("데이터 미리보기:")
print(df.head())

# 평균 점수 계산
df['평균'] = df[['국어', '영어', '수학']].mean(axis=1)
print("\n학생별 평균 점수:")
print(df[['이름','평균']])

(2) Matplotlib으로 데이터 시각화

import matplotlib.pyplot as plt

# 학생별 평균 점수 시각화
plt.figure(figsize=(8,5))
plt.bar(df['이름'], df['평균'], color='skyblue')
plt.title("학생별 평균 점수")
plt.xlabel("학생")
plt.ylabel("평균 점수")
plt.ylim(0, 100)
plt.show()

(3) 간단한 머신러닝 예제 (Scikit-learn)

from sklearn.linear_model import LinearRegression
import numpy as np

# 공부 시간(x)과 시험 점수(y) 데이터
x = np.array([1, 2, 3, 4, 5]).reshape(-1,1)
y = np.array([40, 50, 60, 70, 80])

# 선형 회귀 모델 학습
model = LinearRegression()
model.fit(x, y)

# 예측
predict = model.predict([[6]])
print("공부 시간 6시간일 때 예상 점수:", predict[0])

6. 장점과 단점

✅ 장점: 직관적, 시각화 친화적, 문서화 가능
❌ 단점: 대규모 프로젝트 관리 어려움, 실행 순서 꼬임 문제, Git 충돌 발생 가능

7. 활용 팁

  • 단축키 활용: Shift+Enter, A, B, M, Y
  • nbextensions 확장 기능 설치
  • Git 관리 시 .py 변환 권장

8. 마무리

Jupyter Notebook은 단순한 개발 환경을 넘어, 연구 노트와 보고서, 교육 교재, 실험 플랫폼 역할까지 수행할 수 있는 강력한 도구입니다. 이번 글에서는 설치 방법, 기본 구조, 그리고 실제 예제 코드까지 다뤘습니다. 이제 직접 실행해 보면서 데이터 분석, 시각화, 머신러닝까지 차근차근 익혀보시길 바랍니다.

반응형