티스토리 뷰

디지털 오디오(Digital Audio), 디지타이즈(Digitize)

: 이진법을 사용해 아날로그 신호를 디지털 신호로 변환하는 과정이 포함되며, 아날로그 신호를 샘플링하고 Quantization을 통해 비트 단위로 나눈다. 변환된 디지털 데이터는 0과 1로 구성되며, 이는 전압 형태로 전송되어 복원과정을 거쳐 아날로그 신호로 되돌려진다.

디지털 신호 처리에서는 이진법인 0과 1을 사용하여 오디오 및 비디오 데이터를 저장하고 불러온다. 컴퓨터는 기본적으로 이진법으로 신호를 해석하며, 이진법 체계는 오디오 정보 처리를 위해 필수적이다. ADC(Analog to Digital Converter, 아날로그 디지털 컨버터)와 DAC(Digital to Analog Converter, 디지털 아날로그 컨버터)는 각각 아날로그 신호를 디지털로, 디지털 신호를 아날로그로 변환하는 역할을 한다. 이러한 변환 과정은 디지털 오디오의 기반이 되며, 신호 처리의 중요한 요소로 기능한다. 이에 따라 디지털 음원의 생성 및 처리는 이진법을 통해 이루어진다.

아날로그 신호는 샘플링(Sampling) 과정을 통해 시간 단위로 나누어진다. 샘플링 후, 양자화(Quantization)를 통해 신호의 높낮이를 Bit 단위로 표현한다. 이러한 과정을 통해 원본 아날로그 파형은 디지털 데이터로 변환되며, 이 과정에서 Y축은 비트 깊이(Bit Depth), X축은 샘플레이트(Sample Rate)를 의미한다. 최종적으로 이 변환 과정을 통해 원본 아날로그 파형은 0과 1로 이루어진 데이터로 기록되지만, 시간 사이에 발생한 정보는 생략될 수 있다. 이렇게 생성된 디지털 데이터는 아날로그로 변환되기 위해 점을 찍어 시각화되고 점들을 연결하면 계단 형태의 파형이 형성되며, 이는 원래의 아날로그 신호와 유사한 형태를 만든다. 아날로그 단계에서 로우패스 필터가 적용되므로, 계단 형태의 파형이 다시 선형적인 신호로 변화하게 된다. 이 과정에서 실질적으로 계단 파형이 소리로 변환되는 경우는 없으며, 오버 샘플링을 통해 더 많은 점을 찍어서 계단이 아닌 형태로 개선된다. 따라서, 실제로 좋은 장비로 관찰하면 계단 파형이 나타나지 않음을 알 수 있다.

# 비트(Bit)는 'binary digit'의 줄임말로, binary는 ‘이진수의’라는 뜻으로 두 개의 숫자(0, 1)로 구성된 숫자 체계를 말한다. 0 또는 1이 사용되는 하나의 자리가 비트이다. 즉 0과 1로만 정보를 표현하는 것인데, 0과 1이 어떤 순서로 배열되는지에 따라 다른 정보를 나타낼 수 있다.

 

비트레이트(Bitrate), 비트뎁스(Bit Depth)

: 전자 통신과 컴퓨팅에서 데이터 전송 속도를 의미하며, 보통 1초에 전송되는 비트의 수로 표현된다. 주로 bps(bits per second) 단위로 사용되며, kbps(kilobit per second), Mbps(Megabit per second) 등으로도 표시된다. 높은 비트레이트는 더 많은 데이터를 전송할 수 있게 하여 음질이나 영상 품질을 높이지만, 동시에 파일 크기도 커진다.


오디오 비트레이트 예시

  • Mono 16-bit 44.1kHz 오디오 : 16비트 × 44,100 샘플/초 = 705kbps
  • Stereo 16-bit 44.1kHz 오디오 : 16비트 × 44,100 샘플/초 × 2 채널 = 1,411kbps
  • Mono 24-bit 96kHz 의 경우 24 x 96000 = 2,304,000 bps, 2.3Mbps

영상 비트레이트 예시

1080p 해상도의 24fps 영상 : 1픽셀당 24비트(RGB)이며, 해상도와 프레임 수에 따라 대략 1200Mbps 정도의 비트레이트를 가질 수 있다. 이 값은 압축되지 않은 상태의 이론적인 수치로, 실제 저장 시에는 코덱을 사용해 압축하게 된다.

비트레이트 인코딩 방식

  • CBR(Constant Bit Rate) : 일정한 비트레이트로 인코딩하여 데이터 사용량이 균일하나, 움직임이 많은 경우 화질이 떨어질 수 있다.
  • VBR(Variable Bit Rate) : 장면의 복잡도에 따라 비트레이트를 조절해 화질이 높아지지만, 파일 크기가 일정하지 않을 수 있다.
  • ABR(Average Bit Rate) : 목표 평균 비트레이트를 유지하면서 VBR처럼 가변적으로 인코딩한다.

CBR은 전송 안정성에 유리하지만, 화질의 저하가 있을 수 있다. 반면 VBR은 높은 품질을 제공하나 데이터 사용이 일정하지 않으며 처리에 더 높은 연산이 필요하다.

SQNR(Signal-to-Quantization-Noise Ratio, 신호 양자화 잡음비)신호와 Quantization 노이즈의 비율을 나타내며, 이는 dB로 측정된다. CD의 Bit Depth는 16Bit로, 이 경우 SQNR은 96 dB에 해당하며, 이는 다이나믹 레인지의 차이를 의미한다. 레코딩과 마스터링 과정에서는 주로 24Bit가 사용되며, 32Bit 플로팅 포인트와 40Bit 플로팅 포인트는 주로 ADC나 DAC에 사용되지 않는다. 24Bit는 144dB의 다이나믹 레인지를 제공하며, 이는 Quantization 노이즈가 -44 dB SPL로 들릴 정도로 넓다. 실제로 사람이 들을 수 있는 소리의 범위는 약 100dB로, 144dB의 범위는 일상생활에서 충분히 표현할 수 있다. 음악 감상 용도에서는 16Bit 이상의 깊이가 필요하지 않을 수 있으나, 레코딩 스튜디오 등 전문적인 환경에서는 다이나믹 레인지 손실을 방지하기 위해 24Bit를 사용하는 것이 중요하다. 

 

비트레이트 표준 장치 속도

웬 (WAN) 랜 (LAN) 무선랜
• 1972: 어쿠스틱 커플러 300 보
• 1985: 1200 보
• 1990: 
모뎀 속도: 2400 / 4800 / 9600 / 19200 비트/초
• 1995: 
v.34 모뎀 (28.8 k비트/초), v.90 모뎀 (56 k비트/초)
• 1996: 
ISDN (두 개의 64 k비트/초 채널)
• 1998: 
ADSL (128 k비트/초 ~ 8 M비트/초), ADSL2 (최대 12 메가비트/초), ADSL2+ (최대 24 메가비트/초)
• 1972: IEEE 802.3 이더넷 2.94 M비트/초
• 1985: 10b2 10 M비트/초 동축선
• 1990: 
10bT 10 M비트/초
• 1995: 100bT 100 M비트/초
• 1999: 1000bT (기가비트) 1 G비트/초
• 2003: 10GBASE 10 G비트/초
• 1997: 802.11 2 M비트/초
• 1999: 
802.11b 11 M비트/초
• 1999: 
802.11a 54 M비트/초
• 2003: 
802.11g 54 M비트/초
• 2005: 
802.11g (사유) 108 M비트/초
• 2007: 
802.11n 540 M비트/초

 

멀티미디어

오디오 (MP3)

  • 32 킬로비트/초 — MW (AM) 품질
  • 96 킬로비트/초 — FM 품질
  • 128–160 킬로비트/초 — 표준 비트레이트 품질; 차이는 이따금씩 분명해질 수 있다 (이를테면 베이스 품질)
  • 192 킬로비트/초 — DAB (디지털 오디오 방송) 품질.
  • 224–320 킬로비트/초 — CD 품질 정도.

다른 오디오

  • 800 비트/초 - 적어도 알아들을 수 있는 말하기에 필요 (특수 목적의 FS-1015 코덱 사용)
  • 8 킬로비트/초 - 전화 품질
  • ~500 킬로비트/초 - 손실 데이터 압축 중 OGG 코덱의 최대 비트레이트
  • 500 킬로비트/초–1 M비트/초 - 무손실 오디오 - FLAC, WavPack, Monkey's Audio 등의 코덱 사용
  • 1411 킬로비트/초 - 콤팩트 디스크 디지털 오디오의 PCM 소리 포맷
  • 96~640 킬로비트/초 - 손실 데이터 압축 중 돌비 디지털 (DD)규격의 비트레이트 범위
  • 32~1644 킬로비트/초 - 손실 데이터 압축 중 돌비 디지털 플러스 (DD+)규격의 비트레이트 범위

비디오

  • 400 킬로비트/초 — 유튜브 240p 영상 품질 (H.264)
  • 750 킬로비트/초 — 유튜브 360p 영상 품질 (H.264)
  • 1 메가비트/초 — 유튜브 480p 영상 품질 (H.264)
  • 최대 1.15 메가비트/초 — VCD MPEG1, Video CD Standard 품질
  • 2.5 메가비트/초 — 유튜브 720p 영상 품질 (H.264)
  • 2.52 메가비트/초 — SVCD MPEG2, Super Video CD 품질
  • 일반적으로 3.5 메가비트/초 — SDTV 품질 (MPEG2)
  • 3.8 메가비트/초 — 유튜브 720p (60fps 모드) 영상 품질 (H.264)
  • 4.5 메가비트/초 — 유튜브 1080p 영상 품질 (H.264)
  • 6.8 메가비트/초 — 유튜브 1080p (60fps 모드) 영상 품질 (H.264)
  • 9.8 메가비트/초 — DVD MPEG2, DVD Standard 품질
  • 8~15 메가비트 /초 — HDTV 품질 (H.264)
  • 13~19 메가비트/초 — HDTV (MPEG2) 일반적으로 HD 화질이라고 하는 것, *.ts, *.tp의 일반적인 품질
  • 평균 19 메가비트/초 — HDV 720p 품질 (MPEG2)
  • 24 메가비트/초 — AVCHD (H.264)
  • 평균 25 메가비트/초 — HDV 1080i 품질 (MPEG2)
  • 최대 29.4 메가비트/초 — HD DVD 품질
  • 최대 40 메가비트/초 — Blu-ray Disc 품질 (MPEG2, H.264 또는 VC-1)

 

# 8 bit = 1 B(byte)로 1바이트는 8비트와 동일하지만, kb(kilobit) ≠ kB(KiloByte)에서 보듯 다른 단위 표기에 주의해야 한다. 1 kb(kilobit) = 1024 bit = 128 B(byte) /  8192 bit = 1024 B(byte) = 1 kB(kilobyte)

1 kbps 1,000 bps
1 Mbps 1,000 kbps
1 Gbps 1,000 Mbps
1 Tbps 1,000 Gbps

 

bps  통신 속도
1 Mbps 초당 0.125MB 로드
10 Mbps 초당 1.25MB 로드
100 Mbps 초당 12.5MB 로드
500 Mbps 초당 62.5MB 로드
1 Gbps 초당 125MB 로드
10 Gbps 초당 1.25GB (1,250MB) 로드
100 Gbps 초당 12.5GB (12,500MB) 로드
1 Tbps 초당 125GB (125,000MB) 로드

# 1 character = 1 Byte = 8 bit, bps = bit per second , cps = character per second, 1 cps = 1 Byte/s = 8 bps 보통 bps를 bytes per second로 착각하는 경우도 있다. 실제로는 비트 단위의 속도를 나타내기 때문에 바이트 단위로 변환할 경우 수치가 확 줄어드는 것을 볼 수 있다.

 

샘플 레이트(Sample Rate), 샘플링 레이트(Sampling Rate)

: 아날로그 신호를 디지털 신호로 변환할 때 시간축에 따라 샘플링을 수행하는 빈도를 의미한다. 샘플링 레이트는 샘플링의 정교함을 나타내는 주파수를 의미하며, 1초 단위 샘플링 횟수(1초에 몇 번 자르는지)를 비율에 따라 표시하는 값이다. 파형의 적절한 표현을 위해서는 최소한의 샘플레이트를 고려하는 것이 필수적이다. 11kHz, 22kHz, 44kHz 등으로 구분되며, 예를 들어 44kHz는 입력되는 아날로그 데이터를 1초 동안 44,000번으로 세분하여 샘플링한 것이다. 샘플링 레이트가 높을수록 원음에 가까운 음질을 유지할 수 있지만, 그만큼 데이터 용량도 증가하게 된다. 일반 CD는 44.1kHz, DVD 오디오는 48kHz의 샘플링 레이트를 가진다.

샘플링 레이트는 표현하려는 주파수의 두 배가 필요하며, 이것은 인간의 귀의 가청 한계인 20kHz와 관련이 있다. 가청 범위 20kHz를 표현하기 위해서는 40kHz의 샘플링 레이트가 요구된다. CD의 샘플링 레이트는 44.1kHz로 설정되어 있으며, 이는 최대 표현 주파수가 22.05kHz가 됨을 의미한다. 이러한 샘플링 레이트의 설정은 단순히 기분을 좋게 하기 위한 것이 아니라, 각진 파형이 아닌 부드러운 파형의 생성을 위해 필요한 기술적인 이유가 있다.

로우패스 필터는 신호를 처리할 때 필수적으로 필요한 요소이며, 필터를 거치면 둥근 파형으로 변환된다. 아날로그 단계에서 로우패스 필터의 슬로프는 소리가 갑작스럽게 잘리지 않고 자연스럽게 감소하도록 설계되어야 한다. 20kHz를 완전하게 표현하기 위해서는 20kHz에서 22.05kHz까지의 슬로프(slope)가 필요하며, 이는 여유를 두고 필터링을 하는 이유이기도 하다. 48kHz의 샘플링 레이트는 더 높은 대역을 표현하기 위한 것이 아니라 로우패스 필터를 여유 있게 사용하기 위한 선택으로 이해된다. 필터의 슬로프를 낮추면 왜곡을 줄일 수 있으며, 그 결과 신호를 더 완전하게 수신할 수 있도록 설계할 수 있다. 레코딩 시장에서 가장 많이 사용되는 샘플링 레이트는 96kHz이며, 이는 리소스 소모를 적절히 관리하며 넉넉한 상태로 설정된 것이다. 그러나 96kHz 이상의 샘플링 레이트가 반드시 큰 이점을 제공하는 것은 아니며, 본질적으로 음질 개선의 효과는 크지 않다고 판단된다. 반면에, 많은 사용자들은 48kHz보다 96kHz, 16비트보다 24비트에서 더 나은 품질을 경험하는 경향이 있지만, 16비트와 24비트, 48kHz와 96kHz의 차이를 느끼는 것이 쉽지 않다. AB 테스트를 통해 음원의 차이를 비교하는 방법으로도, 차이를 구분하는 것이 매우 어렵다고 언급된다.

# 대부분의 사람들은 최고 한계인 20kHz 근처 주파수도 잘 듣지 못하며, 나이가 들수록 감지할 수 있는 주파수 범위가 줄어든다.

44.1kHz 샘플링 레이트
- 44.1kHz는 가청 주파수의 상한 20kHz의 두 배 이상으로 설정되어있다. 이는 나이퀴스트 이론에 따라 신호를 정확히 복원하기 위해 필요한 최소 샘플링 레이트를 만족하기 위해서다.
- 또한, NTSC(525 라인)와 PAL(625 라인) 등 비디오 형식과의 호환성을 고려해 정해졌으며, CD의 표준 샘플링 레이트로 자리 잡았다.

48kHz 샘플링 레이트
- Sony의 DAT (Digital Audio Tape)에서 채택한 샘플링 레이트이다. CD와 달리 24비트 깊이로, 48kHz의 샘플링 레이트는 더 넓은 다이내믹 레인지를 제공한다. 이는 고해상도 오디오 녹음에 적합하며, 안티 앨리어싱 필터가 더욱 중요하게 작용한다.
- 48kHz는 44.1kHz 대비 향상된 성능을 제공해 스튜디오 환경에서 DAT 레코더로 믹스된 트랙을 마스터링할 때 주로 사용되었다.

 

나이퀴스트 주파수(Nyquist frequency)

: 나이퀴스트 주파수는 샘플링 주파수의 절반을 의미한다. 이는 공학자 해리 나이퀴스트(Harry Nyquist)의 이론에 따르면, 아날로그 신호를 정확하게 디지털로 변환하기 위해서는 그 신호의 가장 높은 주파수 성분의 최소 두 배 이상의 주파수로 샘플링해야 한다. 다시 말해, 디지털 신호를 샘플링할 때 최대 주파수는 샘플링 주파수의 1/2 이하이어야 신호를 정확히 샘플링할 수 있다. 따라서 고주파 성분이 포함된 신호를 샘플링하기 위해서는 샘플링 주파수가 높아야 한다.

 

사용되는 주요 샘플링 레이트 목록

샘플링 레이트 이용
8,000 Hz 전화, 암호화된 워키토키, 무선 인터콤, 무선 마이크로폰 전송; 치찰음(/s/, /f/)을 제외하고 인간의 모든 음성에 적합하다.
11,025 Hz 오디오 CD 샘플링 레이트의 1/4; 서브우퍼 대역 주파수 오디오 분석을 위한 MPEG 오디오, 낮은 품질의 PCM에 사용됨.
16,000 Hz 표준 전화 협대역인 8,000 Hz보다 높은 광대역 주파수 확장. VoIP
22,050 Hz 오디오 CD의 샘플링 레이트의 절반. 낮은 품질의 PCM과 MPEG 오디오, 그리고 낮은 주파수 에너지의 오디오 분석을 위해 사용됨. 78 rpm 같은 20 세기 초기 오디오 포맷에 적합하다.
32,000 Hz 미니DV 디지털 비디오캠코더, 추가적인 오디오 채널을 갖고 있는 비디오 테입 (예를 들어 4 가지 오디오 채널을 지원하는 DVCAM), DAT (LP 모드), 독일의 Digitales Satellitenradio, 몇몇 국가에서 아날로그 텔레비전 소리로 사용되는 NICAM 디지털 오디오. 고품질 디지털무선 마이크로폰. FM 라디오를 디지털화하는 데 적합하다.
44,056 Hz NTSC '색상' 비디오 신호에 한정된 디지털 오디오에 사용.
44,100 Hz 오디오 CD, MPEG-1 오디오(VCD, SVCD, MP3)와 거의 보통 사용됨. 25(PAL) 또는 30(NTSC '모노크롬 영상 녹화) FPS로 작동하는 수정된 영상 장치에서 기록될 수 있고 당시 전문 아날로그 녹화 장치에 맞추기 위해 필수적이라고 여겨졌던 20 kHz 대역폭을 커버할 수 있기 때문에 원래 소니가 채택하였다.

PCM 어댑터는 디지털 오디오 샘플을 아날로그 비디오 채널에 맞춘다. 많은 전문 오디오 장비들은 믹서, 이퀄라이저, 압축기, 리버브, 크로스오버, 녹음 장치, CD 품질 암호화 무선 마이크로폰 44.1 kHz 샘플링을 사용한다.
47,250 Hz 닛폰 컬럼비아가 개발한 세계 첫 상용 PCM 소리 녹음기(Denon)
48,000 Hz 테입 레코더, 비디오 서버, 비전 믹서 등 전문 디지털 영상 장비에 사용되는 표준 오디오 샘플링 레이트. 이 샘플링 레이트는 22 kHz 주파수 응답으로 전송할 수 있으며 25, 30, 24 FPS와 마찬가지로 29.97 FPS NTSC 영상으로 작동하기 때문에 채택된다.
50,000 Hz 3M과 사운드스트림에서 70년대 후반의 첫 상용 디지털 오디오 녹음기 First commercial digital audio recorders from the late 70s from 3M and Soundstream.
50,400 Hz 미쓰비시 X-80 디지털 오디오 녹음기가 사용하는 샘플링 레이트.
88,200 Hz CD를 위해 사용할 때에 몇몇 전문 녹음 장비가 사용하는 샘플링 레이트. 몇몇 전문 오디오 장비는 믹서, 이퀄라이저, 압축기, 리버브, 크로스오버, 녹음 장비를 포함해서 88.2 kHz 샘플링을 사용한다.
96,000 Hz DVD-Audio, 몇몇 LPCM DVD 트랙, BD-ROM (블루레이 디스크) 오디오 트랙, HD DVD 오디오 트랙. 대부분의 전문 오디오 장비는 믹서, 이퀄라이저, 압축기, 리버브, 크로스오버, 녹음 장치를 포함하는 96 kHz 샘플링을 사용한다. 이 샘플링 주파수는 전문 비디오 장비에서 보통 사용되는 48 kHz 표준의 두 배이다.
176,400 Hz CD 제작을 위한 HDCD 녹음기와 다른 전문 소프트웨어에 사용되는 샘플링 레이트.
192,000 Hz DVD 오디오, 몇몇 LPCM DVD 트랙, BD-ROM (블루레이 디스크) 오디오 트랙, HD DVD 오디오 트랙, HD 오디오 녹음 기기 및 오디오 편집 소프트웨어. 이 샘플링 주파수는 전문 영상 장비의 오디오에 보통 사용되는 48 kHz 표준의 4배.
352,800 Hz 1비트 DSD가 편집에 적합하므로 수퍼 오디오 CD를 기록하고 편집하는데 사용하는 Digital eXtreme Definition 44.1 kHz의 주파수의 8배.
2,822,400 Hz SACD, 소니와 필립스사가 공동 개발한 다이렉트 스트림 디지털로 알려진 1비트 델타 시그마 변조과정.
5,644,800 Hz 더블레이트 DSD, SACD의 2배속으로 1비트 다이렉트 스트림 디지털. 몇몇 전문 DSD 녹음기에 사용.

 

728x90