본문 바로가기
Coding Test/Programmers

[Programmers / MySQL] 년, 월, 성별 별 상품 구매 회원 수 구하기 (Level 4)

by ngool 2024. 10. 14.

📌 문제

문제 설명

다음은 어느 의류 쇼핑몰에 가입한 회원 정보를 담은 USER_INFO 테이블과 온라인 상품 판매 정보를 담은 ONLINE_SALE 테이블 입니다. USER_INFO 테이블은 아래와 같은 구조로 되어있으며 USER_ID, GENDER, AGE, JOINED는 각각 회원 ID, 성별, 나이, 가입일을 나타냅니다.

 

GENDER 컬럼은 비어있거나 0 또는 1의 값을 가지며 0인 경우 남자를, 1인 경우는 여자를 나타냅니다.

ONLINE_SALE 테이블은 아래와 같은 구조로 되어있으며, ONLINE_SALE_ID, USER_ID, PRODUCT_ID, SALES_AMOUNT, SALES_DATE는 각각 온라인 상품 판매 ID, 회원 ID, 상품 ID, 판매량, 판매일을 나타냅니다.

 

동일한 날짜, 회원 ID, 상품 ID 조합에 대해서는 하나의 판매 데이터만 존재합니다.

 

문제

USER_INFO 테이블과 ONLINE_SALE 테이블에서 년, 월, 성별 별로 상품을 구매한 회원수를 집계하는 SQL문을 작성해주세요. 결과는 년, 월, 성별을 기준으로 오름차순 정렬해주세요. 이때, 성별 정보가 없는 경우 결과에서 제외해주세요.

 

예시

예를 들어 USER_INFO 테이블이 다음과 같고

 

ONLINE_SALE 테이블이 다음과 같다면

 

2022년 1월에 상품을 구매한 회원은 USER_ID 가 1(GENDER=1), 4(GENDER=0)인 회원들이고,
2022년 2월에 상품을 구매한 회원은 USER_ID 가 2(GENDER=NULL), 5(GENDER=1), 6(GENDER=1)인 회원들 이므로,

 

년, 월, 성별 별로 상품을 구매한 회원수를 집계하고, 년, 월, 성별을 기준으로 오름차순 정렬하면 다음과 같은 결과가 나와야 합니다.


📌 나의 풀이

Code

SELECT YEAR(SALES_DATE) AS YEAR, MONTH(SALES_DATE) AS MONTH, GENDER, 
    COUNT(DISTINCT USER_ID) AS USERS
FROM USER_INFO 
JOIN ONLINE_SALE USING (USER_ID)
WHERE GENDER IS NOT NULL
GROUP BY YEAR(SALES_DATE), MONTH(SALES_DATE), GENDER
ORDER BY YEAR(SALES_DATE), MONTH(SALES_DATE), GENDER;

Solution

1. USER_ID 필드를 기준으로 USER_INFO와 ONLINE_SALE 테이블을 INNER JOIN

  • USING 활용

2. GENDER가 NULL이 아닌 레코드만 필터링

 

3. SALES_DATE의 년도, 월, 그리고 성별(GENDER)로 그룹화

  • GROUP BY 안에서 YEAR()과 같은 함수 사용 가능!

4. YEAR에 대해 오름차순 정렬, 같다면 MONTH에 대해 오름차순 정렬, 또 같다면 GENDER에 대해 오름차순 정렬

 

5. YEAR, MONTH, GENDER, 그리고 각 그룹에 존재하는 USER_ID 개수만 가져오기

  • USER_ID 개수를 가져오기 위해서는 COUNT() 안에서 USER_ID 앞에 DISTINCT를 추가해줘야 함=> 한 사람이 여러 번 구입했을 수도 있기 때문

📌 다른 사람의 풀이

Code

SELECT YEAR(B.SALES_DATE) AS YEAR, 
	MONTH(B.SALES_DATE) AS MONTH,
        A.GENDER AS GENDER, 
        COUNT(DISTINCT A.USER_ID) AS USERS
FROM USER_INFO A JOIN ONLINE_SALE B ON A.USER_ID = B.USER_ID
GROUP BY YEAR(SALES_DATE), MONTH(SALES_DATE), GENDER
HAVING GENDER IS NOT NULL 
ORDER BY YEAR(SALES_DATE), MONTH(SALES_DATE), GENDER

 

Solution

1. USER_ID 필드를 기준으로 USER_INFO와 ONLINE_SALE 테이블을 INNER JOIN

 

2. SALES_DATE의 년도, 월, 그리고 성별(GENDER)로 그룹화

 

3. HAVING을 활용하여 GENDER 필드가 NULL이 아닌 레코드만 필터링

 

4. YEAR에 대해 오름차순 정렬, 같다면 MONTH에 대해 오름차순 정렬, 또 같다면 GENDER에 대해 오름차순 정렬

 

5. YEAR, MONTH, GENDER, 그리고 각 그룹에 존재하는 USER_ID 개수만 가져오기


배운 내용

다른 사람의 풀이를 보면, HAVING 절에 집계 함수가 아닌 조건을 넣어도 쿼리가 잘 작동하고 있습니다.

 

그러나 HAVING집계 함수가 들어간 조건을 필터링하는 것이 주 존재 목적이므로,

굳이 이런 상황에서는 HAVING을 쓸 필요는 없어 보입니다.

 

집계 함수를 사용한 조건을 필터링 할 때에는 HAVING,
그렇지 않을 때에는 그냥 WHERE을 사용하자!