본문 바로가기

database

ORACLE에서 한글을 지원하는 캐릭터셋

KO16KSC5601

KS 표준 완성형 코드 : KSC5601-1987

이름에서 알 수 있는 바와 같이 이 캐릭터셋은 표준 한글 완성형 코드와 일치한다. 완성형은 일반적으로 많이 사용되는 2350자의 한글을 25*94 매트릭스에 배열한 문자셋이며, 4888자의 한자와 히라카나, 카타카나, 그리고 영문 및 각종 기호들을 포함하고 있다.

HTML : <meta http-equiv="Content-Type" content="text/html; charset=EUC-KR" />

JSP : <%@ page contentType="text/html; charset=EUC-KR" %>

 


KO16MSWIN949

MS-Windows 확장 완성형 한글 : MS949

Windows-949 캐릭터셋은 마이크로소프트사의 Windows Codepage 949, 즉 한글 코드 페이지를 따른 코드셋이다. 이는 완성형(KO16KSC5601)을 그대로 포함하고 있으며, 추가로 현대 한글 조합으로 표현할 수 있는 모든 가짓수에 해당하는 8822자의 한글을 추가해 포함하고 있다. 그러니까 "Windows-949 캐릭터셋은 KSC5601의 수퍼셋(Superset)"이 되며, 따라서 "KO16MSWIN949 또한 KO16KSC5601의 수퍼셋"이 된다.

HTML : <meta http-equiv="Content-Type" content="text/html; charset=MS949" />

JSP : <%@ page contentType="text/html; charset=MS949" %>

 

 

UTF8/AL32UTF8

유니코드 : UTF-8

UTF8은 유니코드를 구현한 캐릭터셋 중에 가변길이 인코딩 방식을 택하고 있는 캐릭터셋이다. 가변 길이를 위해 일종의 플래그 비트를 각 바이트마다 포함시켜야 하다보니, 한 글자를 표한하는데 필요한 바이트의 길이가 최대 3바이트(AL32UTF8의 경우 6바이트)까지 늘어날 수 있다. 유니코드는 잘 알려진 바와 같이 현대 한글 11172자를 모두 가나다 순으로 잘 정렬된 상태로 포함하고 있다. 그래도 한글 한 자가 3바이트의 물리적 공간을 차지하므로, 오로지 모든 한글을 지원한다는 이유만으로 사용하는 것은 곤란하다. 하지만, 한글 이외에도 다른 언어들을 함께 데이터베이스에 저장해야 한다면 다른 선택의 여지가 없는 유일한 선택이 된다.

HTML : <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />

JSP : <%@ page contentType="text/html; charset=UTF-8" %>

 

 

위와같이 오라클에서 사용할 수 있는 캐릭터셋은 총 4가지인데, 이중 KO16KSC56012350자의 완성형 한글만 사용할 수 있다. 이것만은 피해야 할 일 같다.

 

출처 : http://www.oracle.com/technology/global/kr/pub/columns/oracle_nls_1.html

'database' 카테고리의 다른 글

날짜 포함 비교 Query  (0) 2008.07.08
Database 버전 확인  (0) 2008.04.16
ORACLE dictionary (user_updatable_columns)  (0) 2007.12.06
ORACLE dictionary (all_tab_cols)  (0) 2007.11.30
JEUS XAException발생시 처리방법  (0) 2007.11.20