티스토리 뷰

유니코드는 국제적으로 전 세계 언어를 모두 표시할 수 있는 표준코드이다.

 

유니코드의 목적은 현존하는 문자 인코딩 방법들을 모두 유니코드로 교체하려는 것이다.

기존의 인코딩들은 다국어 환경에서는 서로 호환되지 않아 한정된다는 문제점이 있었다.

 

그래서 유니코드를 사용한다.

 

유니코드는 전 세계의 든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계된 표준 코드이다.

유니코드는 2바이트, 즉 16비트를 사용해 2^16가지(65536)를 표현할 수 있다.

resource: Unicode.org

 

참고로 '가'는 유니코드로 U+AC00이다.

'각'은 유니코드로 U+AC01이다.

 

이와 같이 표준 코드로 언어를 나타낼 수 있다.


UTF는 (Unicode Transformation Format)의 약자이다.

UTF는 UTF-8, UTF-16등을 포함한다.

 

UTF-8은 유니코드를 인코딩하는 방식이다. 

UTF=8 인코딩은 유니코드 한 문자를 나타내기 위해 1바이트에서 4바이트까지를 사용한다.

 

https://ko.wikipedia.org/wiki/%EC%9C%A0%EB%8B%88%EC%BD%94%EB%93%9C

https://ko.wikipedia.org/wiki/UTF-8

 

'Tech > What I've Learned' 카테고리의 다른 글

직렬화(Serialization)란  (0) 2019.12.05
머신러닝 추천 생성하기  (0) 2019.11.26
난수는 어떻게 생성될까?  (0) 2019.10.11
스트링  (0) 2019.10.08
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/06   »
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30
글 보관함