ANSI와 UNICODE 차이 알아보기

IT/CS

ANSI와 UNICODE 차이 알아보기

Eri_n 2022. 5. 19. 18:13

cf) ASCII (American Standard Code for Information Interchange)
- 최초의 문자열 인코딩
- 7 bit로 구성됨.
- 영어를 위한 문자, 숫자, 특수문자, 기호 등 128개 문자 표현 가능.
- SBCS에 해당.
- 다른 언어 지원안됨.

↓

So, 다른 언어를 지원해야 할 필요가 생겨 만들어진 인코딩: ANSI

◎ ANSI

- 8bit로 구성, 256개의 문자를 표현할 수 있다.

- ASCII의 확장판 (ASCII에서 1bit를 더 사용한 것)

=> 앞 7bit는 ASCII와 동일, 뒤에 1bit를 이용하여 다른 언어의 문자를 표현한다.

- CodePage: 각 언어별로 Code 값을 주고, Code마다 다른 문자열 표를 의미하도록 약속.

ANSI = ASCII(7bit) + CodePage(1bit)

◎ UNICODE

- 전 세계의 모든 문자를 컴퓨터에서 일관되게 표현할 수 있도록 고안된 문자 집합

(모든 문자에 index 지정)

=> Code Point (Code Unit)

- 코드가 더 빠르게 수행되며 더 작은 메모리를 사용하고, 윈도우가 제공하는 모든 함수를

쉽게 사용할 수 있기에 유니코드를 사용하는 것이 권고 됨.

- WBCS 방식에 해당 됨.

- 유니코드를 표현하는 여러 가지 '인코딩' 방식들이 존재 (UTF-8, 16, 32...)

[ 유니코드를 표현하는 여러가지 '인코딩' 방식 ]

▷ UTF-8
- 8비트 단위로 인코딩하는 방식.
- 한 문자를 나타내기 위해 1byte ~ 4byte까지 사용.
- 인터넷에 교환되는 대부분의 파일에 사용 됨.
- 영문 byte 수 : 1byte
한글 byte 수 : 3byte

▷ UTF-16
- 16비트 단위로 인코딩하는 방식.
- 아스키코드와 호환이 어렵다.
- 유니코드 한 문자를 나타내기 위해 2byte ~ 4byte까지 사용.
- 윈도우 응용프로그램, 자바스크립트 등의 작동 시 사용됨.
- 영문 byte 수 : 2byte
한글 byte 수 : 2byte

▷ UTF-32
- 모든 글자를 4바이트로 표현.
- 저장공간의 낭비가 심하다는 단점이 있다. so, 네트워크 전송 방식으로 사용 안함.
- 프로그램 내부에서만 사용.

'IT > CS' 카테고리의 다른 글

IT개발/ 서버 직무 기술면접 질문 정리 - rest api, was, JSP, Servlet, MVC패턴, get/post 방식 등 (0)	2022.05.24
개발 CS 지식 기술면접 질문 정리 (2)- Iterator, 컴파일러, 인터프리터, 프로세스, 스레드 등 (0)	2022.05.23
개발 CS 지식 기술면접 질문 정리 (1) - 해시 테이블, 정렬 알고리즘, 자료구조, 프로그래밍 방법론 (0)	2022.05.22
트래픽 공격의 유형 - TCP, UDP, ICMP, Smurf 플러딩 공격 (0)	2022.05.20
프로세스, PID, UAC, Integrity Level 용어 조사 (0)	2022.05.19

현재글ANSI와 UNICODE 차이 알아보기

삶을 여행하는 블로거 Eri_n입니다. 개발, IT, 보안 취업 및 전공 내용 + 소소한 일상등을 포스팅 합니다 :)

IT내용, 개발면접, 개발cs지식, RST Flooding, 칸다소바서촌, 오만과편견리뷰, 달과6펜스후기, ACK Flooding, 개발직무면접, 칸다소바혼밥, 서버직무, 리엑트네이티브, 취업안될때, 자바 정리, 카카오면접, 서촌혼밥, CS면접질문, 기술면접, cs면접, 하이디라오영등포점,

Today :
Yesterday :

일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

삶을 여행하다