http://www.sqler.com/104920

일단 간단히 저에 대해 소개를 하자면, 이제 MCAD의 자격을 가지고, MS.NET 쪽 개발을 3년을 넘어 4년째로 넘어든 
개발자입니다. 저역시 처음에는 Join에 대한 명확한 이해가 없어서 많은 고생을 했습니다. 
왜 여기에서는 Left를 여기에서는 Inner를 써야 하는지 이해가 가질 않았습니다. 
그러나 하나씩, 둘씩 개발을 하다 보니 이런곳에는 Left를 이런곳에는 Inner를 써야 하는구나 라는 이해가 오더군요. 
그래서 다 알고 계실지 모르지만, Tip중에서는 이 Join에 대한 정확한 설명이 되어 있지 않아 이렇게 좀 허접한 내용이 
라도 다른 사람에게 조금 도움이 될수 있을 거란 희망을 가지고 설명을 하고자 합니다. 
서론이 길어져 버렸네요.. ^^ 모두들 이해 부탁드립니다. 

전에 Q&A에 란에 올려 놓은 글이 있지만, 그 예제에 조금 살을 붙혀 글을 올리도록 하겠습니다. 

1. LEFT OUTER JOIN(LEFT JOIN 이라고도 한다.) 
LEFT OUTER JOIN(차후 LEFT JOIN 이라 칭하겠다.) 은 A라는 테이블과 B라는 테이블이 있다면 그 두 테이블중에서 
기준을 세우는 테이블을 왼쪽에 두고 JOIN을 하려는 명령입니다. 

그래서 A LEFT JOIN B 라고 하면 A라는 테이블의 전체 컬럼을 조회한후 B테이블의 컬럼을 JOIN하겠다는 뜻입니다. 
그리고 ON조건은 B 테이블을 JOIN 하는 조건을 기술하는 곳입니다. 

어렵게 설명이 되었을지 몰라 예를 들어 설명하겠습니다. 

A테이블이 

지역명, A물품 수량 
----------------- 
가 30 
나 20 
다 40 
라 50 
마 100 

B테이블이 

지역명, B물품 수량 
------------------ 
가 50 
나 70 
다 80 
마 20 
바 200 
사 150 

라고 하면 

DECLARE @ATable Table 
( 지역명 nvarchar(10) 
,A물품수량 int) 

DECLARE @BTable Table 
( 지역명 nvarchar(10) 
,B물품수량 int) 

INSERT INTO @ATable VALUES("가", 30) 
INSERT INTO @ATable VALUES("나", 30) 
INSERT INTO @ATable VALUES("다", 40) 
INSERT INTO @ATable VALUES("라", 50) 
INSERT INTO @ATable VALUES("마", 100) 

INSERT INTO @BTable VALUES("가", 50) 
INSERT INTO @BTable VALUES("나", 70) 
INSERT INTO @BTable VALUES("다", 80) 
INSERT INTO @BTable VALUES("마", 20) 
INSERT INTO @BTable VALUES("바", 200) 
INSERT INTO @BTable VALUES("사", 150) 

SELECT A.지역명, A.A물품수량, B.지역명, B.B물품수량 
FROM @ATable AS A 
LEFT JOIN @BTable AS B 
ON(A.지역명 = B.지역명) 

이걸 실행 시키면 

지역명, A물품수량, 지역명, B물품수량 
-------------------------------------- 
가 30 가 50 
나 30 나 70 
다 40 다 80 
라 50 NULL NULL 
마 100 마 20 

이런식으로 결과가 출력된다. 

즉 A테이블의 전체 데이터가 출력이 되구, ON조건인 A.지역명 = B.지역명인 데이터만 B테이블에서 조회해서 같은 
A테이블에 맞는 로우에 데이터를 출력시켜 주는 조건이다.. 

이해가 되었는지 모르겠네요.. 

2.RIGHT JOIN 
LEFT JOIN을 이해했다면 진짜 쉬어지는 JOIN입니다. 
LEFT JOIN의 정 반대이기 때문입니다. 
즉 기준이 되는 테이블을 오른쪽에 있는 테이블을 기준으로 두고, JOIN을 한다는 것입니다. 
위의 두 테이블에 대해 다음과 같은 쿼리를 실행하면 다음과 같은 결과가 출력됩니다. 


SELECT A.지역명, A.A물품수량, B.지역명, B.B물품수량 
FROM @ATable AS A 
RIGHT JOIN @BTable AS B 
ON(A.지역명 = B.지역명) 

지역명, A물품수량, 지역명, B물품수량 
-------------------------------------- 
가 30 가 50 
나 30 나 70 
다 40 다 80 
마 100 마 20 
NULL NULL 바 200 
NULL NULL 사 150 

이렇게 출력이 됩니다. 

3. INNER조건은 무엇인가 

다음과 같은 쿼리를 실행해 보면 아래와 같다. 

SELECT A.지역명, A.A물품수량, B.지역명, B.B물품수량 
FROM @ATable AS A 
INNER JOIN @BTable AS B 
ON(A.지역명 = B.지역명) 

지역명, A물품수량, 지역명, B물품수량 
-------------------------------------- 
가 30 가 50 
나 30 나 70 
다 40 다 80 
마 100 마 20 

이건결과가 출력된다. 

즉 A테이블과 B테이블에 전부 존재하는 데이터만 조회하라는 의미이다.(물론 ON조건에 만족하는 데이터) 
집합으로 표현하면 교집합이다. 
좀 설명하기가 애매하지만, 이런식으로 이해하면 될것 같다. 
1번째로 LEFT JOIN을 한후, 2번째 RIGHT JOIN을 한다. 
3번째 중복된 데이터를 제거한다. 
4번째 전체 컬럼에 NULL이 있는 데이터는 제거한다. 
이렇게 설명하면 될것 같네요.. ^^ 
물론 매카니즘적인 설명은 아니지만, 굳이 설명하자면 위처럼 하면 될것 같네요. 


4. FULL OUTER JOIN 

다음과 같은 쿼리를 실행해 보면 아래와 같다. 

SELECT A.지역명, A.A물품수량, B.지역명, B.B물품수량 
FROM @ATable AS A 
FULL OUTER JOIN @BTable AS B 
ON(A.지역명 = B.지역명) 

지역명, A물품수량, 지역명, B물품수량 
-------------------------------------- 
가 30 가 50 
나 30 나 70 
다 40 다 80 
라 50 NULL NULL 
마 100 마 20 
NULL NULL 바 200 
NULL NULL 사 150 

즉 두 테이블의 합집합을 나타낸다. 
조건에 맞는 데이터는 같은 로우에 표현해주고 다른 데이터는 다른 로우에 표현해주는 방법이다. 
좀 설명하기가 애매하지만, 이런식으로 이해하면 될것 같다. 
1번째로 LEFT JOIN을 한후, 2번째 RIGHT JOIN을 한다. 
3번째 중복된 데이터를 제거한다. 
이렇게 설명하면 될것 같네요.. ^^ 


5. CROSS JOIN 

다음의 쿼리를 실행해보자 

SELECT A.지역명, A.A물품수량, B.지역명, B.B물품수량 
FROM @ATable AS A, @BTable AS B 

지역명, A물품수량, 지역명, B물품수량 
-------------------------------------- 
가 30 가 50 
나 30 가 50 
다 40 가 50 
라 50 가 50 
마 100 가 50 
가 30 나 70 
나 30 나 70 
다 40 나 70 
라 50 나 70 
마 100 나 70 
가 30 다 80 
나 30 다 80 
다 40 다 80 
라 50 다 80 
마 100 다 80 
가 30 마 20 
나 30 마 20 
다 40 마 20 
라 50 마 20 
마 100 마 20 
가 30 바 200 
나 30 바 200 
다 40 바 200 
라 50 바 200 
마 100 바 200 
가 30 사 150 
나 30 사 150 
다 40 사 150 
라 50 사 150 
마 100 사 150 

이렇듯 모든 경우에 대해 표현을 해주는 것이 CROSS 조인이다. 
즉 A테이블의 한 데이터(로우에 대해) B테이블 전체를 조인하는 것이다. 
그래서 전체 로우수도 N x M 로우가 된다. 

읽어보면서 각 쿼리를 실행해보면 각 JOIN에 대해 어느정도 이해가 갈 것이다. 
이것을 이용하여 각종 쿼리를 만들어 내는 것이다. 

LEFT, RIGHT JOIN의 경우 어는 테이블을 기준으로 삼느냐에 따라 쿼리가 달라질수 있다. 
좀 어려운 이야기 일수 있는데, 데이터가 많은 테이블을 기준으로 삼느냐, 적은 테이블을 기준으로 삼느냐에 따라 
데이터 건수가 조정되기 때문이다. 즉 자신이 원하는 데이터가 있는 테이블을 기준으로 삼으면 그 데이터 전체를 
표현할수 있을것이다. 

허접하지만, 3여년 동안 프로젝트를 수행하면서 얻었던 나만의 지식이었다. 처음에 많이 혼란스러웠던 이유들 중 
어떤 JOIN을 써야 하며, 어느쪽을 기준으로 삼느냐에 따라 달라지는 데이터들 때문에 혼란스러웠지만, 
지금은 이런 기준에 따라 JOIN을 한다. 
다른 사람들도 전부 알고 있을지도 모르지만, 체험을 하면서 얻었던 나만의 지식이라 할수 있다.(물론 다른 많은 
SQLER 가족들도 알고 계시겠지만요.. ^^) 

Q&A에 JOIN에 대??질문들이 상당히 존재하는 것 같아 도움이 될지 몰라 올립니다. 
 

'Databases' 카테고리의 다른 글

MYSQL 테이블 데이타 사이즈  (0) 2011.04.19
mssql 테이블 복사 쿼리  (2) 2011.04.18
MS-SQL DATETIME 형변환(CONVERT)  (0) 2011.03.04
MS-SQL datetime 데이터형 컬럼 검색  (0) 2011.03.04
MS-SQL 2008 설치  (0) 2011.01.05

+ Recent posts