CS/DB

[혼공SQL] MySQL의 데이터 형식

F12:) 2024. 1. 15. 20:28

 

데이터베이스에 값을 저장하기 위해서는 데이터를 저장할 공간이 필요합니다. 하지만 데이터베이스에서 우리가 어떤 값을 입력하냐에 따라서 항상 고정된 크기만큼을 할당하거나, 항상 데이터의 길이를 체크해서 공간을 할당하는 것은 상당히 비효율적으로 보입니다.

 

따라서 사용자가 데이터베이스의 테이블을 구성할 때, 각 열에 입력할 데이터의 형식을 지정해주어, 데이터를 효율적으로 저장할 수 있습니다.

 

그 중에서도 MySQL에는 어떤 데이터 형식이 있는지를 알아보겠습니다.

 

  데이터 형식

MySQL에서는 데이터의 형식이 크게 정수형, 문자형, 실수형, 날짜형, 대규모 데이터 전용 형식이 존재합니다. 이에 대해 자세하게 알아봅시다.

 

정수형 

 

데이터 형식 바이트 수 숫자 범위
TINYINT 1 -128 ~ 127
SMALLINT 2 -32,768 ~ 32,767
INT 4 약 -21억 ~ 21억
BIGINT 8 약 -900경 ~ 900경

이 외에도 BIT, MEDIUMINT가 있지만 잘 사용하지 않습니다.

 

정수형은 크게 4가지로 나뉩니다. 각 데이터의 형식에서는 표시할 수 있는 범위가 정해져있습니다. 만약 이 범위를 넘는 값을 입력하게 된다면 Out of range 오류가 발생하게 됩니다.

 

하지만 우리가 128을 입력하기 위해서 TINYINT를 쓰는 것이 아닌, SMALLINT를 쓰는 것은 약간의 아쉬움이 남습니다. 이에 각 데이터 형식의 뒤에 UNSIGNED라는 키워드를 붙여주어, 음수를 표현하지 않고 범위를 늘릴 수 있습니다.

CREATE TABLE member {
	mem_number TINYINT,
    height TINYINT UNSIGNED -- height는 0부터 255까지의 범위를 갖게 됩니다.
};

 

문자형

 

데이터 형식 바이트 수
CHAR(바이트 수) 1 ~ 255
VARCHAR(바이트 수) 1 ~ 16,383

이 외에도 BINARY, VARBINARY가 있지만 잘 사용하지 않습니다.

 

CHAR와 VARCHAR는 입력할 수 있는 바이트 수의 범위가 다르다는 차이점도 있지만 또 한가지 큰 차이점이 있습니다. CHAR는 입력한 바이트 수만큼의 공간을 고정적으로 할당받게 됩니다. 따라서 우리가 8글자를 입력하는 CHAR(8)를 선언한 후에, 2글자만 입력하게 되면 6바이트를 낭비하게 되는 셈입니다.

 

이 때, VARCHAR를 사용합니다. VARCHAR는 입력된 데이터의 크기만큼의 공간을 할당 받습니다. 할당되는 공간의 최대 크기는 VARCHAR(n)에서 n에 해당합니다.

 

그러나 성능 상으로는 CHAR가 더 좋습니다. 따라서 정말 크기가 변해야만하는 '지역', '나라'와 같은 데이터에 VARCHAR를 사용하고 나머지는 CHAR의 사용을 권장합니다.

 

 

또한 문자형과 정수형 중 어느 데이터 형식을 써야하는지 헷갈리는 때가 있습니다. 마치 숫자로만 구성된 일련번호와 같은 것이 이에 해당할 수 있습니다.

 

이럴 때는 아래의 두 조건 중 하나라도 만족하는 지를 확인해봅시다. 만약 하나라도 만족한다면, 정수형으로 사용하면 되고 하나라도 만족하지 않는다면 문자형 사용을 추천합니다.

  • 더하기/빼기 등의 연산에 의미가 있다.
  • 크다/작다 또는 순서에 의미가 있다.

 

기본적으로 문자형이 정수형보다는 더 효율적이라고 합니다.(정수형에서는 다양한 연산을 수행할 수 있기에 그렇지 않을까 싶습니다.)

따라서 적절한 상황에 맞게 데이터 형식을 지정하는 것이 좋습니다.

 

대량의 데이터

 

데이터 형식 바이트 수
TEXT 형식 TEXT 1 ~ 65,535
LONGTEXT 1 ~ 4,294,967,295
BLOB 형식 BLOB 1 ~ 65,535
LONGBLOB 1 ~ 4,294,967,295

이 외에도 TINYTEXT, MEDIUMTEXT, TINYBLOBK, MEDIUMBLOB 등이 있지만 잘 사용하지 않습니다.

 

대량의 데이터를 위해서 사용하는 데이터 형식입니다.

 

TEXT 형식은 보통 소설이나 영화의 자막을 입력하는데 사용됩니다. 

BLOB 형식은 Binary Long OBject의 약자로 이진 데이터를 의미합니다. 사진, 동영상 같은 데이터를 저장하는데 사용됩니다.

 

해당 형식은 최대 4G까지의 데이터를 저장할 수 있습니다.

 

실수형

데이터 형식 바이트 수 설명
FLOAT 4 소수점 아래 7자리까지 표현
DOUBLE 8 소숮ㅁ 아래 15자리까지 표현

 

DOUBLE은 보통 과학 기술 데이터에 사용되며, 그것을 제외한 대부분의 소수점을 이용하는 데이터는 FLOAT을 사용합니다.

 

날짜형

데이터 형식 바이트 수 설명
DATE 3 날짜만 저장. YYYY-MM-DD 형식으로 사용
TIME 3 시간만 저장. HH:MM:SS 형식으로 사용
DATETIME 8 날짜 및 시간을 저장. YYYY-MM-DD HH:MM:SS 형식으로 사용