SQL Server 2000에서 varchar와 char 데이터 타입(1)

SQL Server 2000에서는 오라클과는 달리 가변길이(varchar) 문자열과 고정길이(char) 문자열의 비교시 공백에 의한 문제가 발생하지 않는다.

오라클의 경우 문자열 뒤의 공백에 따라서 다른 결과가 나올 수 있지만, SQL Server 2000은 문자열 뒤에 포함된 공백이 비교 결과에 영향을 미치지 않는다.

테스트를 통해서 SQL Server 2000과 오라클의 차이점을 확인해 보도록 하자.

[ 오라클 8.1.7 ]

create table tab1 (
고정5 char(5),
가변5 varchar2(5),
고정10 char(10),
가변10 varchar2(10)
);

insert into tab1 /*공백 없음*/ values("A","A","A","A");

insert into tab1 /*공백 1개*/ values("A ","A ","A ","A ");

insert into tab1 /*공백 4개*/ values
("A ","A ","A ","A ");

위와 같이 데이터를 입력하고 실제 데이터를 조회해 보자.

select "[" || 고정5 || "]" as 고정5, "[" || 가변5 || "]" as 가변5,"[" || 고정10 || "]" as 고정10, "[" || 가변10 || "]" as 가변10
from tab1;

고정5   가변5   고정10   가변10
------- ------- ------------ ------------
[A    ] [A]     [A         ] [A]

[A    ] [A ]    [A         ] [A ]

[A    ] [A    ] [A         ] [A    ]

조회결과는 예상한 그대로이다. varchar2는 입력한 값(공백을 포함한) 만큼만 저장이 되고, char는 나머지 자리가 모두 공백으로 채워졌다.

이 상태에서 다음 SQL을 실행하면 어떤 결과가 나올까?

SQL #1)

select "[" || a.가변5 || "]" as 가변5, "[" || b.가변10 || "]" as 가변10
from tab1 a, tab1 b
where a.가변5 = b.가변10;

가변5   가변10
------- ------------
[A]     [A]

[A ]    [A ]

[A    ] [A    ]

문자열 뒤의 공백을 포함한 모든 문자가 동일한 경우에만 결과가 출력된다. 그럼 다음 3개 SQL의 결과는 어떨까?

SQL #2)

select "[" || 고정5 || "]" as 고정5, "[" || 고정10 || "]" as 고정10
from tab1
where 고정5 = 고정10;

고정5   고정10
------- ------------
[A    ] [A         ]
[A    ] [A         ]
[A    ] [A         ]

SQL #3)

select "[" || 가변5 || "]" as 가변5, "[" || 고정5 || "]" as 고정5
from tab1
where 가변5 = 고정5;

가변5   고정5
------- -------
[A    ] [A    ]

SQL #4)

select "[" || 가변10 || "]" as 가변10, "[" || 고정10 || "]" as 고정10
from tab1
where 가변10 = 고정10;

선택된 레코드가 없습니다.

예상과 일치하는가? 가변길이 컬럼과 고정길이 컬럼이 비교되는 경우, 문자열 뒤의 공백까지 정확히 일치해야만 결과가 나타난다. 자세한 내용은 대용량 데이터베이스 솔루션 I권의 문자타입의 비교법칙에 관한 부분(309 ~ 313 페이지)을 참고하기 바란다.
SQL Server 2000에서는 어떤 결과가 나오는지 확인해 보자.

[ SQL Server 2000 ]

create table tab1 (
고정5 char(5),
가변5 varchar (5),
고정10 char(10),
가변10 varchar (10)
)

go

insert into tab1 /*공백 없음*/ values("A","A","A","A")
insert into tab1 /*공백 1개*/ values("A ","A ","A ","A ")
insert into tab1 /*공백 4개*/ values
("A ","A ","A ","A ")

위와 같이 데이터를 입력하고 실제 데이터를 조회해 보자.

select "[" + 고정5 + "]" as 고정5, "[" + 가변5 + "]" as 가변5,"[" + 고정10 + "]" as 고정10, "[" + 가변10 + "]" as 가변10 from tab1

고정5     가변5     고정10         가변10
------- ------- ------------ ------------
[A    ] [A]     [A         ] [A]
[A    ] [A ]    [A        ] [A ]
[A    ] [A    ] [A        ] [A    ]

(3개 행 적용됨)

여기까지는 오라클과 동일하다. 그러면 다음 4개 SQL의 실행결과도 과연 동일할까?

SQL #1)

select "[" + a.가변5 + "]" as 가변5, "[" + b.가변10 + "]" as 가변10
from tab1 a, tab1 b
where a.가변5 = b.가변10

가변5     가변10
------- ------------
[A]     [A]
[A ]    [A]
[A    ] [A]
[A]     [A ]
[A ]    [A ]
[A    ] [A ]
[A]     [A    ]
[A ]    [A    ]
[A    ] [A    ]

(9개 행 적용됨)

오라클과는 다른 결과이다. 문자열 뒤의 공백 개수와 상관없이 결과가 출력된다.

오라클 사용자가 SQL Server 2000이나 Sybase ASE를 사용할 경우에 착각하기 쉬운 부분이므로 주의해야 한다.

SQL #2)
select "[" + 고정5 + "]" as 고정5, "[" + 고정10 + "]" as 고정10
from tab1
where 고정5 = 고정10

고정5     고정10
------- ------------
[A    ] [A        ]
[A    ] [A        ]
[A    ] [A        ]

(3개 행 적용됨)

고정길이 컬럼의 경우 대용량 데이터베이스 솔루션 I권에서 설명한 문자타입의 비교법칙이 동일하게 적용된다.

SQL #3)
select "[" + 가변5 + "]" as 가변5, "[" + 고정5 + "]" as 고정5
from tab1
where 가변5 = 고정5;

가변5     고정5
------- -------
[A]     [A    ]
[A ]    [A    ]
[A   ] [A   ]

(3개 행 적용됨)

이 결과도 오라클과 다르다. 분명 문자열 뒤의 공백의 개수가 다르지만 같은 값으로 인식하고 있다.

SQL #4)
select "[" + 가변10 + "]" as 가변10, "[" + 고정10 + "]" as 고정10
from tab1
where 가변10 = 고정10

가변10         고정10
------------ ------------
[A]          [A         ]
[A ]          [A         ]
[A    ]       [A         ]

(3개 행 적용됨)

이 결과도 오라클과 다르다. 오라클에서는 [선택된 레코드가 없습니다]라는 메시지가 나왔지만, SQL Server 2000에서는 문자열 뒤의 공백에 상관없이 동일한 값으로 처리하고 있다.

SQL Server 2000에서의 "문자타입의 비교법칙"은 대용량 데이터베이스 솔루션 I권에 소개된 내용과 크게 다르지 않다. 다만 가변길이 컬럼과 고정길이 컬럼의 비교시에만 약간 다른 방식으로 처리되고 있다.

이 내용은 또 다른 테스트를 통해서 확인했으며 다음 회에서 문자타입이 다른 경우의 처리속도 및 타입의 크기(size)에 따른 영향 등을 포함해서 더 자세히 소개하도록 하겠다.


제공 : DB포탈사이트 DBguide.net

+ Recent posts