Domowe studio nagrań: Jak usunąć wokal z piosenki

Możliwości współczesnych programów muzycznych i komputerów wydają się wielu osobom
nieograniczone, a że ktoś-gdzieś-u-kogoś słyszał, że podobno można "wyciąć wokal z numeru",
pytanie o technologię tego zabiegu bardzo często pojawia się w naszej redakcyjnej poczcie...
Funkcję tzw. "wycinania wokalu" znajdziecie w niektórych urządzeniach studyjnych (w pewnych
modelach procesorów efektów i sprzętowych rejestratorów) oraz programach muzycznych.
Producenci sugerują, że z jej pomocą można usunąć główny wokal w komercyjnym nagraniu
stereo, a tym samym przygotować gotowy podkład np. dla potrzeb karaoke. Wszystkie znaki na
Niebie i Ziemi wskazują na to, że taka operacja nie zawsze przynosi zadowalające rezultaty.
Powód? Gotowe nagranie jest zbiorem niezliczonej liczby wzajemnie przenikających się
częstotliwości składowych, wśród których nawet najbardziej inteligentny algorytm nie jest w stanie
wyłowić tych, które odpowiedzialne są za wokal i zostawić nienaruszone składowe generowane
przez instrumenty. Co więcej, wokal - szczególnie w muzyce dance i pop - często bywa nagrywany
metodą wielokrotnych nakładek i wzbogacania każdej z nich o inny efekt, dzięki czemu brzmi on
szeroko i potężnie. Zabiegi te sprawiają, że ścieżki wokalu zajmują bardzo szerokie spektrum
częstotliwości i ich całkowite wycięcie bez wycięcia (lub znacznego stłumienia poziomu)
znaczącej ilości instrumentów wykorzystanych w aranżacji jest praktycznie niemożliwe.
Czy to oznacza, że jesteśmy całkowicie pozbawieni szans na usunięcie wokalu z komercyjnych
śladów stereo? Nie do końca. W poniższym artykule postaramy się opisać sposób, który daje się
zastosować w praktyce i w wielu przypadkach przynosi korzystne efekty.

W ten sposób kopiuje się zawartość jednego kanału w edytorze Sound Forge. Z rozwijanego menu wybierz Copy,
co przeniesie zaznaczony fragment do Schowka.
Wszystkie algorytmy wycinania wokalu wykorzystują fakt, iż jest on zazwyczaj umieszczany
centralnie w panoramie stereo. Źródło sygnału słyszalne w samym środku przestrzeni dźwiękowej
jest z taką samą głośnością obecne zarówno w lewym, jak i prawym głośniku. Jeśli odejmiemy od
siebie sygnały z obu kanałów, stopień stłumienia dźwięków w panoramie stereo będzie odwrotnie
proporcjonalny do różnic w ich poziomach między obydwoma kanałami. Mówiąc inaczej - jeśli ten
sam sygnał ma identyczny poziom w lewym i prawym kanale, wówczas po odjęciu teoretycznie
powinien całkowicie zniknąć z obrazu dźwiękowego.
Jak się "odejmuje" od siebie kanały? Wystarczy odwrócić polaryzację jednego z nich. Jeśli masz
ochotę na kilka prostych eksperymentów, otwórz nowy dokument (stereofoniczny plik dźwiękowy)
np. w Sound Forge'u, z menu Tools wybierz narzędzie syntezy i wygeneruj krótki sygnał
sinusoidalny. Zaznacz jeden z kanałów, kliknij prawym klawiszem myszy i wybierz funkcję
odwrócenia polaryzacji. Teraz zamień plik stereo na plik mono klikając na przebiegu prawym
klawiszem myszy, wybierając Properties i w zakładce Format zaznacz Mono. Zobaczysz, że
przebieg zniknie. Możesz też - bez monofonizacji samego pliku, zmonofonizować odsłuch (jeśli
oczywiście masz taką możliwość). Mimo tego, że na ekranie widzisz przesuwający się po
przebiegu kursor, w głośnikach nie usłyszysz nic. Jeśli jednak zmienisz poziom sygnału w jednym
z kanałów, usłyszysz sygnał, który będzie tym głośniejszy, im większa różnica poziomu między
kanałami.
A jak po zabiegu odwrócenia polaryzacji jednego z kanałów zachowają się instrumenty, które z
natury rzeczy nagrywane są przestrzennie bądź tylko w jednym z kanałów. Sytuacja będzie
analogiczna do wyżej opisanej. Jeśli obróbce poddamy np. cowbell grający tylko w lewym kanale,
to po edycji jego brzmienie i poziom pozostanie praktycznie bez zmian. Jeśli będzie to pad
syntezatorowy szeroko rozstawiony w panoramie, wówczas wszystkie częstotliwości ustawione
bliżej środka będą słyszalne mniej niż te, które "rozstawione" są szerzej. Zazwyczaj stracą na tym
najniższe tony brzmienia, choć z uwagi na charakter tego typu instrumentów nie będzie to aż tak
słyszalne. Na zabiegu odwrócenia polaryzacji ucierpi znacznie bas i stopa zestawu perkusyjnego, a
hi-hat, czynele oraz (choć nie zawsze) werbel, nie zmienią się zbytnio. Uwaga! Nie jest to jednak
regułą. Bardzo dużo zależy od rodzaju muzyki, sposobu realizacji i zastosowanych efektów,
dlatego brzmienie nagrania po odwróceniu polaryzacji jednego kanału nie zawsze jest
przewidywalne.
Dlaczego tak dużo wspominam o odwróceniu polaryzacji? Z prostej przyczyny. Jest to
podstawowy zabieg stosowany przez absolutnie wszystkie programy i urządzenia wycinające

Okno ukazujące się
po wywołaniu funkcji Paste Special w Sound Forge. W zaznaczonym na niebiesko menu wybierz
Normal Mix.
Po odwróceniu polaryzacji sygnału w jednym kanale sumuje się go z nie odwróconym sygnałem z
kanału drugiego. Każda wspólna dla obu kanałów informacja zostaje w ten sposób usunięta, a że
wokal umieszczany jest zazwyczaj w środku panoramy, więc teoretycznie powinien całkowicie
zniknąć. Proces ten ma istotną zaletę - jest bardzo prosty w realizacji. Poza tym ma same wady:
sygnał po obróbce jest monofoniczny, następuje wytłumienie innych instrumentów ustawionych
centralnie w panoramie, pozostają wszelkie "dodatki" do wokalu (chórki, pogłos itp.), nagranie
brzmi nienaturalnie itd.
Wiedząc już z jakimi przeciwnościami musimy sobie poradzić, możemy lepiej przygotować się do
czekającego nas zadania. Choć w tzw. obiegu znajdują się programy służące do wycinania wokalu,
lepiej jest zająć się tą sprawą na własną rękę, bez powierzania tak trudnych operacji bezdusznym
algorytmom. Potrzebny nam będzie dowolny edytor audio (Cool Edit, Sound Forge, Wave Lab
itp.), plik wyjściowy zawierający wokal (czym bardziej czytelny i ustawiony w środku panoramy
tym lepiej...) oraz dobre monitory i odrobina wolnego czasu.

Po załadowaniu do wielośladu Samplitude ścieżek kanału lewego i prawego kliknij na dolnej
połówce jednego z nich i wybierz edycję niszczącą, co pozwoli Ci na odwrócenie polaryzacji pliku
(dodatnie połówki przebiegu zamienią się w ujemne i odwrotnie).
Ładujemy plik do edytora i kopiujemy oddzielnie kanał lewy i oddzielnie prawy do innych okien
edycji. W Sound Forge kanały zaznaczamy przez podwójne kliknięcie na każdym z nich (gdy przy
kursorze pokaże się litera L lub R). Kliknij prawym klawiszem myszy i wybierz z rozwijanego
menu funkcję Copy. Teraz otwórz nowy plik (File>New, zaznacz plik mono), wklej skopiowany
wcześniej kanał poleceniem Ctrl+V i zapisz jako nowy dokument (File>Save As: Lewy.WAV i
Prawy.WAV). W pliku zawierającym skopiowany kanał lewy, za pomocą wybranej wtyczki
programowej lub wbudowanej do edytora funkcji korekcji, stłum wszystkie częstotliwości leżące
poniżej 100Hz z maksymalnym możliwym nachyleniem. Chodzi o to, by z procesu usuwania
sygnałów wspólnych dla obu kanałów wyłączyć chociaż część widma stopy i basu. (Można
wprawdzie odciąć wyżej, np. przy 200Hz, ale jak sam potem usłyszysz, nie zawsze wtedy
całkowicie usuniesz wokal).
Teraz nadeszła pora na zsumowanie sygnałów z nienaruszonego kanału prawego i przed chwilą
obrobionego kanału lewego. Zaznacz wszystko w pliku Lewy.WAV (Ctrl+A), skopiuj (Ctrl+C) i
wklej do pliku Prawy.WAV za pomocą procedury Edit>Paste Special>Mix (upewniwszy się
wcześniej, że kursor znajduje się na początku pliku: Ctrl+Home w aktywnym oknie Prawy.WAV).
Wybierz preset (Name) o nazwie Normal Mix (no fades), zaznacz pole Invert Data w okienku
Source: Clipboard i kliknij przycisk Preview. Teraz spróbuj odrobinę zwiększyć lub zmniejszyć
poziom sygnału wklejanego tak, by uzyskać możliwie najmniejszą zawartość wokalu w sygnale
zmiksowanym. (Jeśli w czasie stosowania podsłuchu monitorowany jest jedynie początkowy
fragment nagrania, udaj się do menu Option>Preferences>zakładka Previews i odznacz okienko
Limit Previews). Wciśnij OK i zapisz efekt swojej pracy jako Final.WAV.
Opisana wyżej metoda działa bardzo dobrze w przypadku typowych nagrań rockowych z silnym
pojedynczym wokalem ustawionym dokładnie w środku panoramy. Załóżmy jednak, że masz do
czynienia z utworem, w którym wokal schowany jest nieco głębiej w aranżacji i nie jest już tak
wyraźny. Potrzebna Ci będzie
inna technika, oparta o edytor wielośladowy lub sekwencer audio/MIDI z możliwością stosowania
wtyczek programowych w poszczególnych śladach: Cool Edit Pro, Cubase, Cakewalk, Logic,
Vegas, Samplitude itp. My posłużymy się tym ostatnim w wersji Project 5.9, którą wraz z obszerną
instrukcją obsługi opublikowaliśmy na naszym krążku we wrześniu ubiegłego roku.
Na oddzielnych ścieżkach edytora umieść przygotowane wcześniej w klasycznym edytorze
monofoniczne pliki Lewy.WAV i Prawy.WAV (technika ich tworzenia identyczna jak wyżej), z
panoramą ustawioną pośrodku. Samplitude ma opcję importu ścieżek z płyt CD Audio oraz
rozbijania plików stereo na dwa pliki monofoniczne, co możesz też wykorzystać zamiast opisanej
wyżej techniki.
Kliknij w dolnej połówce przebiegu ścieżki odpowiadającej zawartości kanału lewego i wybierz
Destructive Edition. Z menu Effects wybierz Invert Phase i kliknij Both Channels.
Zamknij okno edytora niszczącego i w widoku wielośladowym włącz odtwarzanie. Wszystkie
sygnały ustawione w oryginalnym nagraniu stereo po środku panoramy powinny być niesłyszalne.
Otwórz okno miksera, kliknij prawym klawiszem myszy na sekcji korekcji pierwszej ścieżki i na
początek ustaw 20-decybelowe odcięcie częstotliwości poniżej 100Hz i powyżej 14kHz. Teraz
kliknij OK, wróć do miksera i słuchaj czy coś się zmieniło. Regulując gałkami korekcji i
poziomem w pierwszym kanale staraj się doprowadzić do sytuacji, w której wokal będzie najmniej
słyszalny. Co ciekawe, w większości przypadków uzyskasz to przy... wyłączonej korekcji
(podwójne kliknięcia na każdą z gałek HF, MF i LF), ale nie zaszkodzi poeksperymentować.
Uwaga! W niektórych przypadkach obróbka plików za pomocą korekcji programowej lub
zewnętrznych wtyczek może wprowadzać opóźnienia czasowe obrabianego kanału, co nie
pozostaje bez wpływu na głębokość efektu wycięcia wokalu. Najlepiej zatem ustawić efekty,
zaaplikować je w procesie edycji niszczącej, i dopiero wówczas odsłuchać obu ścieżek.

Procedura ustawiania
korekcji w ścieżce z odwróconą polaryzacją. Pokazana na ilustracji krzywa korekcji to baza
wyjściowa do dalszych eksperymentów.
Opisane techniki pozwolą Ci na własne uszy przekonać się o skuteczności najczęściej stosowanego
algorytmu wycinania wokalu. Na tę chwilę nie wymyślono jeszcze nic lepszego, i choć w
niektórych przypadkach działa to całkiem sprawnie, w innych przynosi same szkody - wszystko
zależy od materiału wyjściowego. Pozostaje jeszcze tylko
ustereofonicznienie nagrania. Proponuję zastosowanie jednej z najczęściej stosowanych technik,
polegających na użyciu korekcji graficznej. Do tego celu znów posłużymy się edytorem Sound
Forge. Otwórz w nim wcześniej stworzony plik monofoniczny będący efektem zabiegu wycinania
wokalu (Final.WAV) i zaaplikuj podobną korekcję, jaką pokazano na ilustracji powyżej. Zapisz
plik jako FinalLewy.WAV. Ponownie otwórz Final.WAV i obrób go za pomocą korektora z
pasmami ustawionymi zupełnie odwrotnie (patrz rysunek powyżej) i zapisz jako
FinalPrawy.WAV. Teraz stwórz nowy plik (File>New) wybierając opcję stereo i zapisz go jako
FinalStereo.WAV. Otwórz FinalLewy.WAV, zaznacz (Ctrl+A), skopiuj (Ctrl+C), zamknij okno
(Ctrl+F4) i wklej do FinalStereo.WAV (Ctrl+V) zaznaczając Left Channel i klikając OK. Teraz
ponów powyższą procedurę dla pliku FinalPrawy.WAV, ale zamiast prostego wklejenia (Ctrl+V)
wybierz Edit>Paste Specjal>Mix (opcja Normal Mix), pamiętając o odznaczeniu Invert Data, jeśli
pozostało zaznaczone wcześniej. Teraz tylko zapisz plik (Ctrl+S) i możesz już przysłuchać się
efektom swojej pracy. Być może uzyskany tą metodą efekt stereo nie jest zachwycający, ale i tak
brzmi nieco lepiej niż nagranie mono. Życzymy Wam owocnego eksperymentowania!

Przerabiamy mono
na stereo. Do pliku wyjściowego stosujemy korekcję pokazaną wyżej i zapisujemy pod jedną
nazwą, a następnie aplikujemy tę drugą i zapisujemy pod inną nazwą. Teraz oba pliki wynikowe
zapisujemy jako kanały pliku stereo.

Mecze na żywo

Jak usunąć wokal z piosenki

3 komentarze: