호테의 노트에 오신 것을 환영합니다 🙌

Tableau와 Salesforce, Python과 SQL 등 데이터의 전반적인 것들을 다루는 기술 블로그입니다.

Python 7

Pygwalker - Jupyter Notebook 환경에서 반응형 시각화하기

1. Pygwalker란 무엇인가?Pygwalker는 데이터프레임을 시각적으로 탐색할 수 있는 인터랙티브 시각화 툴입니다.“Python” + “Graphic Walker”의 합성어로, Pandas DataFrame을 마치 Tableau나 Power BI처럼 드래그 앤 드롭 방식으로 시각화할 수 있게 해줍니다.데이터 과학자와 분석가가 Notebook 환경에서 빠르게 데이터를 이해하고, EDA(Exploratory Data Analysis)를 직관적으로 수행할 수 있도록 도와줍니다.2. 주요 기능드래그 앤 드롭 인터페이스차원(범주형 데이터)과 측정값(수치형 데이터)을 끌어다 놓으면 즉시 차트를 생성할 수 있습니다.자동 차트 추천선택한 변수에 따라 막대, 선, 산점도 등 적절한 차트를 제안합니다.Tableau..

Python 2025.08.28

재귀함수 정복하기

1. 재귀함수란?재귀함수는 자기 자신을 다시 호출하는 함수를 말합니다.어느 한 컴퓨터공학과 학생이 유명한 교수님을 찾아가 물었다."재귀함수가 뭔가요?""잘 들어보게. 옛날에 산 꼭대기에 현자가 있었어. 질문엔 모두 지혜롭게 대답 해 주었지.그런데 어느날, 그 선인에게 한 선비가 찾아와서 물었어."재귀함수가 뭔가요?""잘 들어보게. 옛날에 산 꼭대기...2. 재귀함수의 구성요소Base Case (종료 조건): 더 이상 재귀 호출을 하지 않아야 할 조건Recursive Case (자기 자신을 호출하는 부분): 문제를 더 작게 쪼개서 자기 자신을 호출3-1. 예제 1: 팩토리얼 (n!)n! = n × (n-1)!조건: 1! = 1def factorial(n): if n == 1: # 종료 ..

.sort() 와 sorted()의 차이

1 .sort() 와 sorted()의 차이항목.sort()sorted()종류리스트 전용 메서드내장 함수원본 변경✅ 원본 리스트를 직접 정렬 (in-place)❌ 원본은 그대로 두고 새 리스트 생성반환값None (아무것도 반환하지 않음)정렬된 새 리스트 반환적용 대상리스트(list)만 가능리스트, 문자열, 튜플, 딕셔너리 등 모든 반복 가능한 객체 가능가독성한 번만 정렬할 때 사용함수 체이닝 등 다양한 용도에 적합2. 예제 비교로 쉽게 이해하기2-1 .sort() 예제numbers = [3, 1, 4, 2]numbers.sort() # 원본이 정렬됨print(numbers) # ✅ 출력: [1, 2, 3, 4]result = numbers.sort()print(result) # ❌ 출력: Non..

Matplotlib 한글이 깨져서 나올 때

# +) 한글이 깨져서 나와요koreanize_matplotlib은 Colab이나 Jupyter 환경에서 한글 폰트를 간편하게 설정해주는 라이브러리입니다.matplotlib의 설정을 자동으로 바꿔주기 때문에 한글이 깨지지 않도록 도와줍니다.!pip install koreanize-matplotlib #한글폰트 라이브러리 설치!apt-get install -y fonts-nanum #나눔 고딕 폰트 설치import matplotlib.pyplot as pltimport koreanize_matplotlib # 한글 자동 설정됨plt.plot([1, 2, 3], [1, 4, 9])plt.rcParams['font.family'] = 'NanumGothic' #나눔 고딕 폰트 설정plt.title("한글 제..

Python 2025.06.17

Matplotlib을 활용한 다양한 차트 구성

1. 막대 차트- 각 값들의 비교를 할때 시각화- 시각화 영역에서 가장 많이 쓰는 차트# 데이터 준비categories = ['A', 'B', 'C', 'D']values = [10, 20, 15, 25]# 막대 그래프 그리기plt.bar(categories, values)# 그래프 보여주기plt.show()2.산점도 (스캐터 차트)- 두 변수 간의 관계를 시각적으로 표현하는 데 사용되는 그래프- 각 데이터 포인트는 두 변수의 값을 좌표로 하여 점으로 표현- 이를 통해 두 변수 간의 상관 관계, 패턴, 이상치 등을 파악할 수 있음#산점도 그리기np.random.seed(0)n = 50x = np.random.rand(n)y = np.random.rand(n)plt.scatter(x, y)plt.show(..

Python 2025.06.17

Matplotlib을 활용한 데이터 시각화

import numpy as npimport pandas as pd# Matplotlib import & 버전 확인import matplotlibimport matplotlib.pyplot as pltprint(matplotlib.__version__)1. Matplotlib 소개**matplotlib.pyplot** 모듈의 각각의 함수를 사용해서 간편하게 그래프를 만들고 변화를 줄 수 있습니다.예를 들어, 그래프 영역을 만들고, 몇 개의 선을 표현하고, 레이블로 꾸미는 등의 일을 할 수 있습니다.참고 문서 : https://wikidocs.net/book/5011**pyplot.plot()** 함수에 하나의 숫자 리스트를 입력함으로써 아래와 같은 그래프가 그려집니다.**plot()** 함수는 리스트의 ..

Python 2025.06.17

[Python] 딕셔너리 데이터 프레임 변환하기

1. 판다스 불러오기import pandas as pd 2. 딕셔너리 생성new_dict = [        {            "test1": "KOR_2024_0001"        },        {            "test2": "KOR_2024_0002"        },        {            "test3": "KOR_2024_0003"        }            ] 3. 데이터 프레임 변환df = pd.DataFrame(new_dict) 4. 데이터 프레임 csv로 저장df.to_csv("srvy_id.csv", index = False)