[CS 지식] UTF-8 , UTF-16 , 인코딩, 디코딩, MS949, CP949, EUC-KR, KS5601, KSC5636, ISO-8859-1

2021. 6. 19. 01:16

유니코드사에서 모든 언어를 표현하기 위해 만든 코드표

길이가 앞에 뭐가 붙냐에 가변적으로 1바이트로 읽을지 2바이트 읽을지 .. 정한다

[영문 1바이트 한글 3바이트] 문자 한개를 표현하기 위해 8bit 필요하고 문자 하나를 표현하기 위한 바이트 범위 1~ 4바이트 모바일에도 잘 쓰이기 때문에 UTF-8을 자주 사용

문자 한개 16bit 필요하고 문자 하나를 표현하기 위한 바이트 범위 2~4 [영문 2바이트 한글 2바이트]

사람이 인지할 수 있는 형태(글자나 숫자등..)의 데이터를 약속된 규칙에 의해 컴퓨터가 사용하는 0과 1로 변환하는 과정

인코딩된 파일(0 1 로 만들어버린)을 읽어내는 과정

한글 확장 완성형

한글 완성형

MS949의 경우 CP949와 같다는 말이 많지만 MS949의 경우 똠방각하 표현이 가능하지만 하다

CP949의 경우 똠방각하 표현이 불가능 또한 MS949라는 건 자바에서만 사용한다

즉, CP949끼리는 CP949끼리 통신하고 MS949의 경우 MS949끼리 통신하는게 좋다

EUC는 아시아계 문자를 표현하기 위해 개발한 코드 체계이다.

→ EUC-KR = KSC5636 + KSC5601

자주 쓰이는 2350자만 가나다 순으로 배열이 되어있다.

한글 문자수는 11176개라 나머지 8000여개는 없는 셈이다.

영문자에 대한 표준 기존 ASCII Code에서 역슬래쉬(\)를 원(\) 표시로 대체

서유럽 언어 표기에 필요한 문자 코드

[CS 지식] UI, UX, 가상디스크, 스풀, 로더, FAT, 인자 vs 매개변수 (0)	2021.06.19
[CS 지식] 프로그래밍, 프로그래밍 언어, 마크업언어, 스크립트 언어, 어셈블러, 어셈블리어, 정적타입언어, 동적타입언어, 기계어, 저급언어, 고급언어 (0)	2021.06.19
[CS 지식] 마이크로프로그램 , 마이크로 명령어, 시스템소프트웨어, 운영체제, ALU , CU, PC(프로그램카운터), OP-Code, Operand (0)	2021.06.19
[CS 지식] 조합논리회로, 순서논리회로, 플립플롭, 논리게이트, CISC, RISC, 클럭, 외부클럭, 내부클럭, 노스브리지 (0)	2021.06.19
[CS 지식] 프로세스, 스레드(Thread), 멀티스레딩, 동기식, 비동기식, 동적, 정적 (0)	2021.06.19

플레이스토어 병아리게임 출시!!!~~ [많은 이용 부탁드립니다!]