WAV

Waveform Audio File Format
Přípona souboru.wav, .wave
Typ internetového médiaaudio/vnd.wave, audio/wav, audio/wave, audio/x-wav
TvůrceMicrosoft a IBM
První verze1991[1]
Poslední verzeMultiple Channel Audio Data and WAVE Files (2007-03-07[2][3])
Kontejner proLPCM a další
Rozšiřuje formátRIFF
RozšířeníBWF, RF64
Otevřený formát?

WAV (případně WAVE) je zkratka a přípona pro zvukový formát Waveform audio file format, který vytvořily firmy IBM a Microsoft pro ukládání zvuku na PC. Jedná se o RIFF kontejner, který obvykle obsahuje nekomprimovaný jedno- nebo vícekanálový zvuk kódovaný pomocí pulzně kódové modulace s lineárním kvantováním (LPCM), často shodný se záznamem na audio CD.

Popis

WAV je speciální varianta obecnějšího formátu RIFF, čímž se podobá formátu 8SVX počítače Amiga a formátu AIFF používaného na počítačích Macintosh.

Formát RIFF slouží jako kontejner a umožňuje ukládat do souboru WAV zvuk v různých formátech, z nichž nejobvyklejší je nekomprimovaná lineární Pulzně kódová modulace (LPCM). Lze využít i různé komprimované formáty, například GSM kompresi, ADPCM, µ-Law či MP3, v naprosté většině případů však soubory WAV obsahují nekomprimovaná LPCM data.

Protože LPCM je bezeztrátový formát, jehož zpracování je snadné a výpočetně nenáročné, používá se nejčastěji WAV jako pracovní formát při zpracování zvuku, jako výchozí formát před další konverzí či pro archivaci či přenos zvukových dat v nejvyšší kvalitě. Díky všeobecnému rozšíření a jednoduché vnitřní struktuře je často formát WAV používán pro přenos zvukových dat mezi různými systémy.

Původní podoba formátu WAV byla s příchodem operačního systému Windows 2000 rozšířena, což umožnilo ukládat vícekanálový zvuk.

Pro ukládání zvukových záznamů se dnes častěji používají komprimované soubory, protože zabírají méně místa. Nejčastěji používané ztrátové formáty jsou MP3, Vorbis Ogg, WMA a AAC. Pokud je potřeba bezeztrátový záznam, je lepší než WAV použít FLAC, Shorten, Monkey's Audio, ATRAC Advanced Lossless, Apple Lossless, WMA Lossless, TTA, nebo WavPack. Nekomprimovaný formát WAV je vhodný pro střih a složitější úpravy zvuku (viz např. Audacity).

Příklad formátu WAVE-PCM

RIFF hlavička (12 bytů):

OffsetTypDélka (v bytech)Obsah
0 (0x00)char4'RIFF'
4 (0x04)unsigned4<velikost souboru> − 8
8 (0x08)char4'WAVE'

Sekce fmt (24 bytů) popisuje formát vzorků:

OffsetDélkaObsahPopis
12 (0x0C)4'fmt 'signatura hlavičky (čtvrtý znak je mezera)
16 (0x10)4<fmt length>Délka zbytku fmt hlavičky (16 bytů)
20 (0x14)2<format tag>Formát obsahu (viz tabulka níže)
22 (0x16)2<channels>Počet kanálů: 1 = mono, 2 = stereo; mohou být i více než 2 kanály (např. pro prostorový zvuk).[4]
24 (0x18)4<sample rate>Vzorků/sec v jednom kanálu (např. 44100)
28 (0x1C)4<bytes/second>vzorků/sec · velikost rámce
32 (0x20)2<block align>Velikost rámce = <Počet kanálů> · ((<bitů/vzorek (v 1 kanálu)> + 7) / 8)   (celočíselné dělení)
34 (0x22)2<bits/sample>Počet datových bitů ve vzorku v 1 kanálu (např. 16)

Datová sekce obsahuje vzorky:

OffsetDélkaObsahPopis
36 (0x24)4'data'signatura hlavičky
40 (0x28)4<length>délka datového bloku, max. <velikost souboru> − 44
44 (0x2C)<block align>první vzorek
<block align>druhý vzorek

Hodnoty pole formát

IDVýznam
0x0001PCM
0x0002MS ADPCM
0x0003IEEE FLOAT
0x0005IBM CVSD
0x0006A-law
0x0007μ-law
0x0010OKI ADPCM
0x0011DVI/IMA ADPCM
0x0012MEDIASPACE ADPCM
0x0013SIERRA ADPCM
0x0014G723 ADPCM
0x0015DIGISTD
0x0016DIGIFIX
0x0017DIALOGIC OKI ADPCM
0x0020YAMAHA ADPCM
0x0021SONARC
0x0022DSPGROUP TRUESPEECH
0x0023ECHOSC1
0x0024AUDIOFILE AF36
0x0025APTX
0x0026AUDIOFILE AF10
0x0030DOLBY AC2
IDVýznam
0x0031GSM610
0x0033ANTEX ADPCME
0x0034CONTROL RES VQLPC
0x0035CONTROL RES VQLPC
0x0036DIGIADPCM
0x0037CONTROL RES CR10
0x0038NMS VBXADPCM
0x0039CS IMAADPCM (Roland RDAC)
0x0040G721 ADPCM
0x0050MPEG-1 Layer I, II
0x0055MPEG-1 Layer III (MP3)
0x0069Xbox ADPCM
0x0200CREATIVE ADPCM
0x0202CREATIVE FASTSPEECH8
0x0203CREATIVE FASTSPEECH10
0x0300FM TOWNS SND
0x1000OLIGSM
0x1001OLIADPCM
0x1002OLICELP
0x1003OLISBC
0x1004OLIOPR

Maximální délka

WAV (RIFF) formát využívá 32bitové hodnoty délky bloků dat nebo délky souboru, proto je velikost souboru omezena na 4 GB[5], což odpovídá asi 6.6 hodinám stereofonního záznamu v CD kvalitě.

Po přechodu společnosti Sonic Foundry Desktop Software na Sony Pictures Digital byl použit formát Sony Pictures Digital Wave 64 nebo Wave64; je poskytována bez licenčních poplatků. Přípona souboru je .w64. Vnitřní struktura je úmyslně založena na konvenčním WAVE, aby se zjednodušila implementace softwaru[6]. Použitím 64bitových polí dosahuje výše uvedená modifikace maximální hrací čas více než 3 miliony let.

Reference

V tomto článku byl použit překlad textu z článku RIFF WAVE na německé Wikipedii.

  1. IBM Corporation a Microsoft Corporation. Multimedia Programming Interface and Data Specifications 1.0 [TXT]. Srpen 1991 [cit. 2009-12-06]. Dostupné v archivu pořízeném dne 2009-04-17. 
  2. P. Kabal. Audio File Format Specifications - WAVE or RIFF WAVE sound file [online]. McGill University, 2006-06-19 [cit. 2010-03-16]. Dostupné online. 
  3. Multiple Channel Audio Data and WAVE Files [online]. Microsoft Corporation, 2007-03-07 [cit. 2010-03-16]. Dostupné online. 
  4. Thomas Höss a Tobias Rieck: WAV-Audio-Format, fmt-chunk Archivováno 27. 6. 2007 na Wayback Machine na it.fht-esslingen.de
  5. http://ccrma.stanford.edu/courses/422/projects/WaveFormat/ Archivováno 27. 8. 2009 na Wayback Machine - nefunkční link
  6. VCS Engineering: Sony Wave64. (PDF) Informace o Sony Wave64 z 2. května 2012.

Externí odkazy