Ljudupptagning

7 min

Ljud är ganska knepigt att spela in till skillnad från bilden. På bilden ser man direkt om någonting är fel, t.ex. färgerna, ljuset, skakig kamera etc. Fel i ljudet måste man lyssna sig till noggrant och det är betydligt svårare än att hitta bildtekniska fel. En bra inspelningmiljö för ljud måste därför vara fri från buller och eko, samtidigt som man måste välja rätt mikrofon och rätt mikrofonavstånd.

En bra ljudinspelning

Vad är egentligen en bra ljudinspelning? En bra ljudinspelning har en hög teknisk kvalitet fri från störningar och brum, samtidigt som det ger dialog och karaktärsljud tydlighet och "fyllighet". Absolut viktigast är tydligheten. I efterarbetet brukar man kunna korrigera små felaktigheter i ljudet och lägga på olika så kallade equalizer-filter som korrigerar bas, diskant och andra frekvensområden. Det är värre med bilden.

En ljudtekniker spelar in dialogljud
Foto: Nils Kim Gustafsson

Möbler och inredning

Alla möbler och saker påverkar ljudet. Generellt kan man säga att mjuka material och ytor (t.ex. mattor, fåtöljer, gardiner och soffor) tar upp ljudet och absorberar det, medan hårda ytor (t.ex. kakel, glas, metall och väggar) studsar tillbaka ljudet. För att få en bra ljudinspelning krävs det att man balanserar dessa material så att man inte får en miljö som har för mycket "dött" ljud eller för mycket eko. Det är därför man alltid lägger till eko och andra ljudeffekter i efterhand, så att man får kontroll över ljudet.

Eko på plats låter oftast "burkigt" och konstigt. Det är dessutom väldigt svårt att få tydlighet i ljudet. Andra typer av störande ljud är bl.a. vindbummel som uppstår när svaga vindpustar når mikrofonen. Detta motverkas lättast genom att sätta en stickad vante på mikrofonen.

I ett rum med mycket "hårt" rum kan man mjuka upp ljudet med mattor, tyger, fördragna gardiner och draperier eller äggkartonger! Äggkartonger har den fördelen att ytan är ojämn, vilket gör att ljudet som inte absorberas, "studsar" i olika riktningar och fördelas jämnt över rummet. Se dock till att inte ljudisolera för mycket, då ljudet kan bli väldigt livlöst och till och med låta "dött".

I ett "mjukt" rum däremot kan hårda material som träfiberskivor, speglar, kakel eller metall underlätta för ljudinspelning.

Absorberande material

  • Plast
  • Trä
  • Mjuka möbler
  • Mattor
  • Gips

Reflekterande material

  • Metall
  • Kakel
  • Glas
  • Speglar
  • Träfiberskivor

Mikrofonavstånd

Det enda man egentligen behöver veta är att ju kortare avstånd mellan mikrofonen och ljudet desto bättre blir ljudet. Ett avstånd på 50 cm är att rekommendera vid en inspelningsplats med "normal" inredning eller miljöljud. Ju mer eko desto kortare måste avståndet vara, t.ex. från 30 cm eller nästan inpå ljudkällan. Undvik dock att gå allt för nära ljudkällan. Då kan så kallade puffljud lätt uppstå, t.ex. ljud med bokstaven "p" som "slår i" mikrofonmembranet.

Arbetar man med myggor, dvs små mikrofoner som kan fästas på exempelvis en slips, är det nödvändigt att placera den på rätt sida om slipsen. Om "offret" vänder huvudet uteslutande åt höger (som t.ex. vid en TV intervju) bör även myggan vara placerad på höger slipskant så att man får bästa täckning på ljudet.

Det är även viktigt att videokameran eller ljudinspelningsutrustningen är inställd på manuell volymreglering. Använder man den automatiska volymregleringen kommer ljudet att "pumpa" när ljudet förändras. Så fort någon pratar sänks ljudet för att inte bli överstyrt. När talaren sedan tystnar ökar ljudnivån till följd av att även bakgrundsljudet ökar.

Innan man startar den riktiga ljudinspelningen måste man alltid göra ett röstprov för att ställa in ljudnivåerna (se dock till så att skådespelarna eller liknande inte höjer rösten inför röstprovet).

Handhållen mikrofon

En mikrofon som hålls i handen är vanligt vid intervjuer och möjliggör en "närbild" av ljudet. Det kräver å andra sidan att man håller den i ett stadigt grepp, för annars kan oljud uppstå när man byter grepp. Håll mikrofonsladen i en ögla runt fingrarna så att det inte uppstår oljud och störningar på grund av glappkontakt, speciellt när man använder amatörkontakter såsom minitele.

Försök även att undvika allt för häftiga vinklingar med mikrofonen mellan dig och den du intervjuar, det blir väldigt irreterande för den som tittar plus att vindljud kan uppstå i riktade mikrofoner. Håll mikrofonen upprätt så att både du och intervjuoffret talar rätt ner i den. Ännu bättre vore att använda en så kallad åtta-kopplad mikrofon, vilken tar upp ljud från två riktningar samtidigt.

Mikrofonbom

Med mikrofonen fäst på en lång bom kan man komma ljudkällan närmare och få ett ganska störningsfritt ljud. Håll mikrofonbommen i ett brett grepp så att du får bra stabilitet och håll bommen under bildkanten i den mån du kan, det är lättare än att hålla den ovanför motivet.

Mikrofonsladden tejpas noga vid bommen i utfällt läge för att inte ge störningar eller fastna i ljudteknikerns armar eller händer. Om man behöver dra in "spöet", dvs göra det kortare, är det bara att snurra bommen så snurras och späns även sladden.

Flera mikrofoner

Två eller fler mikrofoner är användbart när t.ex. två personer pratar med varandra. Med två riktade mikrofoner på var sin mikrofonbom kommer båda mikrofonerna nära ljudkällan. Ljuden läggs ihop i en ljudmixer med en kanal för varje ljudkälla.

I ljudmixern bestämmer man även hur hög ljudnivå varje enskilt ljud skall få. Pratar den ene lite svagare än den andre måste ändå ljudnivån ställas in så att signalen spelas in lika högt. Detta görs för att "trycka undan" alla andra ljud och få en störningsfri ljudinspelning. Under efterarbetet ställs sedan alla ljudnivåer in för att passa varje litet ljud.

Professionella videokameror har oftast en egen nivåkontroll för ljudet vilket eliminerar användandet av en ljudmixer. De flesta mikrofoner är dessutom i mono, vilket gör att man kan använda videobandets stereokanaler för varje mikrofon, men då är det svårt att samtidigt filma som man ska ställa in ljudnivån.

Separat ljudinspelning

Om man vill kan man spela in ljudet separat istället för att med videokameran fånga ljudet. Det är ingenting att rekommendera om man jobbar med video - videobandet har ju ett ljudspår som duger väl, såvida man inte har höga krav på ljudet. Men om man spelar in på 35 mm film eller dylikt så finns det inga ljudspår i kameran (det finns visserligen på vissa filmtyper, men det används ej). Istället så spelar man in på exempelvis en DAT-bandspelare (Digital Audio Tape) som en B-ljudtekniker springer runt med.

Nackdelen med den här tekniken är att man måste synkronisera ihop bilden och ljudet vid redigeringen. Till detta behövs därför en klappa, med vilken man synkar antingen med den smäll som klappan ger när man slår ihop den, eller med hjälp av en visuell tidkod på klappan. Dessutom måste man identifiera varje ljudband väl genom att säga och skriva ner varje scen- och tagningsnummer.

Fördelarna däremot, är att man kan röra sig fritt med ljudutrustningen. Man är ju inte begränsad till de rörelser som fotografen gör. Dessutom är man heller inte begränsad till videoformatets ljudspår som man spelar in på, utan kan välja ett betydligt bättre (eller sämre om man nu vill det av någon anledning).

Ljudreglering

Alla videokameror har någon form utav automatisk nivåkontroll (så kallad Automatic Gain/Level Control eller AGC/ALC) som justerar ljudnivån varefter ljudet förändras. Fördelen med dessa är att man själv slipper tänka på hur ljudet spelas in, men dessa är oftast inte tillräckligt intelligenta utan justerar volymen efter det starkaste ljudet. Det innebär att man kan få en "pumpande" effekt om någon pratar och sedan tystnar. Ljudvolymen ökas när talaren tystnar och bakgrundsljudet blir pinsamt hörbart. Istället bör man slå över till manuell ljudreglering vilket innebär att man själv ställer in volymen på ljudet.

VU-meter För att veta hur hög ljudvolymen är när man spelar in ljudet maneullt, använder man olika typer av utstyrningsinstrument. Den vanligaste formen av dessa instrument är en så kallad Peak-mätare. Det är en pelare med lampor som reagerar blixsnabbt på ljudets förändringar och visar det som grönt, gult och rött. Det röda fälten visar de högsta ljuden. Ett annat utstyrningsinstrument är en så kallad VU-meter (Volume Units), vilket är en analog mätare som är relativt långsam i sin ljudregistrering och visar därför bara ett medelvädre på nivån.

När man styr ut ljudnivån bör den ligga kring en så kallad 0-nivåreferens, eller rättare sagt vid 0 dB (decibel), för optimal ljudinspelning. De högsta ljuden, bör inte gå upp högre än till +3 dB (A). Tal bör ligga mellan -3 dB och 0 dB.

Om man har för hög ljudnivå (så kallad överstyrning) blir ljudet förvrängt och fenomenet distorsion uppstår. Man brukar då säga att ljudet peakar eller clippar. Ställer man däremot in ljudnivån för lågt försvinner ljudet bland bakgrundsbruset.

Normalt används också hörlurar för kontrollysning, där man hör ljudet som mikrofonen fångar in. Att inte använda hörlurar är detsamma som att inte titta i sökaren när man filmar - man har ju praktiskt taget ingen uppfattning om vad som spelas in. Hörlurarna bör omsluta öronen helt så att alla andra ljud stängs ute. Amatörkameror har dock oftast inget uttag för hörlurar och även om de har det, så brukar volymen vara alldeles för låg i dem.

Ljudregistrering

Det finns tre olika sätt att spela in ljud på en videokamera:

Separat ljudspår

På bland annat VHS-band finns ett längsgående analogt spår som ljudet spelas in på.

FM-ljud

Frekvensmodulerat (FM) ljud, eller HD-ljud som det tidigare kallades, innebär att ljudet "bakas ihop" med bilden. Fördelen med detta är att ljudet blir så kallat HiFi-ljud (High Fidelity, hög naturtrogenhet), dvs betydligt bättre än "vanligt" ljud. Nackdelen med HiFi-ljudet är att det alltid hör ihop med bilden. Det går därmed inte att ta bort eller lägga en ny bild utan att ljudet påverkas.

En VHS eller S-VHS kamera med HiFi-ljud har alltid ett seperat ljudspår vid sidan om HiFi-ljudet, varför ljuddubbning är möjlig på dessa kameror. Detta görs för att man även i en vanlig video ska kunna höra ljudet. Ett Hi8 system som spelats in med FM-ljud, har däremot bara detta ljud.

PCM-ljud

PCM-ljud är ett digitalt ljud och betyder Pulse Code Modulation, som spelas in vid sidan om videosignalen. PCM-ljudet finns på vissa avancerade amatörkameror, samt på alla professionella. Ljudkvalite upp till 96 kHz samplingsfrekvens och 32 bitars upplösning (vilket i stort sett är det högsta man kan ha).


Vad tycker du om artikeln?
20
Lär dig mer om film

Vill du hålla koll på det senaste inom film? Gör som tusentals andra och prenumerera på vårt nyhetsbrev om filmskapande. Det skickas måndagar på förmiddagen.


8 kommentarer

  1. Johan Mickels
    Det var en jätte bra artikel, men det jag reflekterade över var kontroll av ljudnivåerna. I artckeln står det att tal ska ligga mellan minus 3 och 0 när man ställer in manuellt. Det är ju jätte högt, jag jobbar inom tvbranchen och då får inte ljudet överstiga -12 med anledning att talaren kanske pratar lite högre på ett ställe. Går de över noll är ljudet förstört. Jag har även hört att SVT vill inte ha högre än -15.
    H. Mickels
  2. Lucas Nilsson
    Håller med om förra kommentaren att mellan -3 och 0 är otroligt vågat när det gäller digital inspelning.
    En annan grej jag reagera på var att du skrev att PCM ljudet spelar in på upp till 96Khz, vilket jag är med på. Men INTE 32 bitar...24 bitar är lyx att spela in på idag :)
  3. gcs
    Hi 8 kameror kunde ha både FM ljud och digitalt 12bitar/32Khz. Sedan som någon tidigare sagt så kan man bara spela in med högst 24 bitar. Högsta samplingfrekvensen är 192Khz. När det gäller nivåerna
    så bör den nominela nivån ligga på -18dBf vilket motsvarar 0,775 millivolt eller Test på en nordiskskala.
    När det gäller toppnivåer i radio(SR) och tv(SVT/TV4)så bör topparna aldrig överstiga -9dBf vilket bettyder 9 dB över Test(0.775 mV). Om någon vill fråga mer så kan ni skriva till mig.
  4. gcs
    En sak till som gäller digital inspelning. När man spelar in musik i en kommersiell studio vill man att topparna ska ligga så nära 0dBf som möjligt eftersom man strävar att uppnå fulldynamik om den nu är stor, dessutom minskar också distorsionen ju närmare 0:an man kommer. Modern popmusik brukar som regel inte ha någon större dynamik.(Kanske inte mer än 15, 20dB)
  5. gcs
    PCM betyder Pulse Code Modulation
  6. gcs
    När det gäller mikrofoner så talas det om cardioid(njure) och åtta-formad(bi-directional):e mikrofoner.
    Det är en viss skillnad på känslighet mellan dessa två typer av mikrofoner. Om man vill ha samma närhets-känsla med dessa två typer av mickar så måste man låta åttan stå närmare. Detta gäller om båda har samma känslighet. Förhållandet blir enligt detta 1:1,4.
    Det finns fler kommentare jag kan göra men jag stannar här.
  7. Niklas
    Denna artikel är väldigt gammal och tyvärr förlegad när de gäller de tekniska aspekterna.
    Ang. inspelningsnivå antar jag att författar utgår från VU och alltså inte tar hänsyn till digital inspelning där man, som det redan nämnts i kommentarerna, inte bör överstiga -10dBfs.
    Vid studioinspelningar (av musik) finns det inte heller någon anledning att spela in nära den digital nollan. Ett mixerbord är normalt sett kalibrerat att motsvara -18dBfs vid 0VU, där bör man även hålla sina inspelningsnivåer.

    För mer info om olika Decibel-skalor, se:
    http://en.wikipedia.org/wiki/Decibel#Common_reference_levels_and_corresponding_units

    ----

    Ang. bitdjup och samplingsfrekvens har vi idag upp till 192kHz samplingsfrekvens och 24-bitars bitdjup. Berwardhallen är en av de få platser där det går att spela in i 28-bitar men en del musikprogram jobbar upp mot 32-bitar, detta är i princip obrukbart överallt annars.

    Vid filminspelning bör du spela in i 48kHz och 16 bitar som minst, helst använder du 24 bitar eftersom du ökar det dynamiska omfånget med 48dB. Mindre än 48kHz gör att du måste sampla upp för att synka med videofilerna och högre än 48kHz gör att den som ska synka och/eller klippa materialet oftast får problem eftersom de har dålig koll på ljudbiten.

    Mvh Niklas
    www.aldenaudio.se
  8. Speeder84XL
    Denna artikel är ju "gammal som gatan" - så många av formaten (framförallt dom analoga) är ju inaktuella. Dock finns det ju 32 bitars ljudinspelare idag. T ex denna som jag tänkt köpa senare:
    https://www.scandinavianphoto.se/zoom/f3-field-recorder-1055447
    Tror dock knappast det fanns då, så det måste varit en feluppfattning. Det fanns inte ens ens solid state-ljudinspelare 2003 tror jag. Jag köpte en av dom första som kom ut på marknaden - Edirol R1 - har för mig det var 2004-2005 någon gång - den hade dock 24 bit - dock bara 44,1 kHz sample rate). På den tiden gjorde jag dock enbart ljudinspelningar och tog stillbilder. En filmkamera med acceptabel bildkvalitet var utanför min budget då.

    Inspelningsförfarandet i början av artikeln, var ju dock verkligen att "gå över ån efter vatten". Dock bra att påpeka problemet med autogain. Det är ingen höjdare att använda och börjar lätt "pumpa" med volymen. Med dom där gamla kamerorna kanske man dock var tvungen att hålla på rigga en massa
    - för dom var ju "a pain in the ass" att använda p g a att bandmekaniken oftast gav ifrån sig ett irriterande surr. Så man kunde inte sätta mickarna på kameran.
    Nu med solid state-kameror har dock det problemet försvunnit.
    På mina filmer använder jag bara 2 rundtagande mickar i stereo med 30-40 cm mellan som man sätter fritt monterade på kameran. Akustiken är bara den naturliga, som är på platsen där man spelar in. Mickarna är helt hembygge med Primo EM273 och tidigare även Panasonic WM61 mikrofonkapslar och custombyggd preamp:
    https://www.youtube.com/@Speeder84XL/videos
    Sen kan man ju få göra undantag, om man t ex ska spela in dialog i bullrig miljö (där det kan bli svårt att uppfatta vad som sägs annars). Men det där blir bra för det allra mesta. Idealiskt vill man ju ha känslan av att stå på kamera position och höra det man ser, plus förväntade ljud runtom.

    Får man problem med att eko på plats låter "burkigt och konstigt" är det dock för man har dåliga grejer. T ex stormembransmickar har oftast dålig upptagning och ojämn frekvensgång på höga frekvenser (>4 kHz), om inte ljudet inte kommer rakt framifrån. I dom flesta miljöer med ljudreflexer och många olika ljudkällor, kommer ljud från alla håll.
    Då blir det lätt lite burkigt och låter ofta lite som att ha en kudde över micken. Dessa mickar fungerar bäst i en studio, där reflexer dämpats bort och det man ska spela in är rakt framför micken.
    Riktade mickar för att få ännu bättre stereo, kan tyckas nice - men bör också undvikas p g a den s k proximitetseffekten. Samma effekt som gör att basen förstärks när man är riktigt nära och som ofta utnyttjas av t ex radiopratare, gäller också omvänt.
    Det avstånd där frekvensgången är rak, är i bästa fall 1 m, oftast inte ens det. Går man längre från ljudkällan och/eller spelar in stora ljudkällor (vilket ju gäller dom flesta ljudkällor som avger mycket bas), så kommer det bli som att lägga in ett högpass filter på kanske 6 dB/oktav under 100-300 Hz. Kommersiella ljudproduktioner har ju notoriskt för lite bas (om man bortser från tillgjorda ljud som explosioner i actionfilmer) och mycket av det beror på överdrivet användande av riktade mickar.

    Om man inte bygger sina mickar själv, som jag gjort, så är det bästa troligtvis att använda t ex Earthworks eller DPAs rundtagande småmembransmodeller eller t ex billigare mätmikrofoner (egenbruset kan dock va högt på en del av dessa, så det får man kolla)

    Sen sist var det ju den andra kommentaren att spela in på -18 dBfs. Det är ju bra att göra när det kommer till svaga ljud, för att ha marginal för oförutsedda toppar. Det är också i relativt tysta miljöer den risken är som störst.
    Där är det i praktiken mickens egenbrus som sätter gränsen för hur mycket brus man får i relation till det ljud man spelar in - dvs sänker man inspelningsnivån, så sänks bruset lika mycket. Bruset bli således inte högre, om man har "för låg" inspelningsnivå.
    Det är däremot idiotiskt att göra detta när det kommer till starka ljud - framförallt ljud med stor dynamik som t ex fyrverkerier, vissa fordon, eller bara t ex kraftiga hammarslag i en tyst miljö (där starka ljud och ljudtoppar blandas med svagare partier).
    I det läget så är det oftast ljudinspelarens, kamerans eller ljudkortets brusgolv som sätter gränsen för hur mycket brus man får, när man ställt den så att topparna uppgår i 0 utan att klippas.
    Sänker man då ytterligare, så sänker man bara ljudet, men bruset blir kvar på samma nivå. Så relativt ljudet, får man då upp till 18 dB! högre brus. Det kan bli rejält märkbart i dom svaga delarna av ljud med stor dynamik.
    Ofta för extremt korta transienter som t ex många fyrverkerismällar, kan man t o m acceptera lite klippning - inte mycket, men om man t ex skjuter av en bombtårta och filmar, så kan man ställa in så dom flesta smällarna toppar runt 0 dBfs - om några enstaka då landar på t ex motsvarande +3 dBfs och klipps vid 0, så gör inte det så mycket.
    Det är oftast bättre det än att få 5-6 dB mer brus i dom tysta delarna (där man har alla ekon och detaljer från omgivningen, ev snack etc.) - som det lätt blir om man justerar ner dessa 3 dB och sen lite till för att få marginal när man inte riktigt vet var högsta toppen hamnar.
Skriv kommentar