데이터분석 기록일지

[Pandas] 기본 함수 정리

Pandas : Python에서 데이터를 조작하고 쉽게 분석할 수 있게 도와주는 라이브러리    1. 데이터 불러오기/ 저장하기1-1. 데이터 불러오기# 불러올 때, index_col =0 을 하면 인덱스가 컬럼으로 불러와지지 않는다.df = pd.read_csv("tips_data.csv", index_col=0)  1-2. 데이터 저장하기# 인덱스 따로 지정해주지 않으면, 인덱스가 컬럼으로 들어갈 수가 있음.data.to_csv("tips_data.csv",index=False) csv말고도 json, html, excel 등 여러 형태가 가능하다.     2. 데이터 내용 확인하기2-1.  데이터 구성 값 확인1)  .columns : 컬럼명 확인df.columns  2)  .index : 인덱스명..

파이썬 2024.08.16 0

[Python] 이터러블(iterable) vs 이터레이터(iterator)

이터러블(iterable)이터러블은 순회(반복) 가능한 객체를 말한다. 즉, 가지고 있는 원소들을 한 번에 하나씩 돌려줄 수 있는 객체이다. 이터러블은 순회를 "당한다"고 이해하면 좋다.  리스트, 튜플, 문자열, 딕셔너리, 집합, range 등이 이터러블에 해당한다.가장 간단하게는 for 문에 들어갈 수 있는 객체라고 이해하면 좋다 또한 이터러블은 "__iter__() 라는 메서드를 이용하여 이터레이터를 생성할 수 있는 객체" 로 정의된다.__iter__() 는 이터러블의 이터레이터를 생성할 수 있는 함수이다.   이터레이터(iterator)이터레이터는 이터러블의 순회를 주관하는 객체이다.(이터러블은 순회를 '당하는' 것이고, 이터레이터가 순회를 '행하는' 개념이다.) 이터레이터는 이터러블에서 값을 하..

파이썬 2024.07.21 0

[Python] 참조(Reference) + 복사(Copy)

sizes = [[60, 50], [30, 70], [60, 30], [80, 40]]for s in sizes: s.sort(reverse = True) print(sizes)# 출력 : [[60, 50], [70, 30], [60, 30], [80, 40]]이 글은 이 코드에서  최초로 시작되었으며..... -> 이 코드에서 for문 내에서 지역 변수인 s를 정렬했는데, 전역 변수인 sizes도 정렬되는게 이해가 안가서 알아보다가 공부하게 된 개념이다. 참조 변수가 어떤 값을 가리키는 것을 참조(reference)라고 한다.리스트, 딕셔너리, 문자열, 숫자 등의 객체를 변수에 할당하면, 해당 변수는 그 객체를 가리키게 된다.즉, 변수는 실제 데이터가 저장된 메모리 공간이 아니라, ..

파이썬 2024.07.05 0

SQL 기본문법

1. SELECT, FROM select : 데이터를 가져오는 기본 명령어로, 데이터를 조회하는 모든 Query 에 사용됨 from : 데이터를 가져올 테이블을 특정해주는 문법 -> select에 *을 넣으면 전체 컬럼을 선택하고, 컬럼의 이름을 적으면 해당 컬럼만 선택하여 보여준다.-> select와 from은 쿼리에 무조건 포함. 1-1) Aliases (별칭)테이블이나 테이블의 컬럼에 임시로 별칭 지정이 가능 (더 간단히 읽고 쓰기 위해서)방법1) 컬럼1 as 별명1방법2) 컬럼2 별명2-> as 는 써도 되고 안써도 된다.구분영문, 언더바, 숫자특수문자, 한글방법별칭만 적음"별명" | 큰 따옴표 안에 적어준다.예시age10"age 50", "나이" 2. WHERE : 특정 조건으로..

SQL 2024.06.05 0

윈도우 함수(Window Function)

📌 윈도우 함수(Window Function)란?윈도우 함수는 행을 그룹화하지 않고 각 행에 대해 특정 범위(윈도우) 내에서 계산을 수행하는 SQL 함수.즉, GROUP BY처럼 데이터를 하나로 합치지 않고도 집계 함수(Aggregate Function) + 추가적인 행 정보를 같이 조회할 수 있다. 📌 윈도우 함수의 기본 구조() OVER (               PARTITION BY               ORDER BY               ROWS BETWEEN ) ✔️ 핵심 요소윈도우 함수 → SUM(), AVG(), RANK() 등 사용 가능OVER() → 윈도우 함수를 사용할 때 필수PARTITION BY → 그룹을 나누는 기준 (선택)ORDER BY → 정렬 기준 (선택..

SQL 2025.02.07 0

[MySQL] Pivot Table 만들기

Pivot table 이란 2개 이상의 기준으로 데이터를 집계할 때, 보기 쉽게 배열하여 보여주는 것을 의미한다. 만드는 방법1. 피벗 테이블에 필요한 데이터를 가공하여 만든다. 2. 1의 데이터를 하위 쿼리로 사용하여, Pivot Table 로 만든다. 예시) 스파르타 [엑셀보다 쉽고 빠른 SQL] 5주차 숙제: 음식 타입별, 연령별 주문건수 피벗테이블을 만들자. (연령은 10~59세 사이) 1. 필요한 데이터를 만들기 -> 음식타입과 필요한 연령별로 묶어서 개수를 카운트select cuisine_type, case when age between 10 and 19 then "10대" when age between 20 and 29 then "20대" when age between..

SQL 2024.06.25 0