보컬로이드

Vocaloid Wiki
(VOCALOID에서 넘어옴)
이동: 둘러보기, 검색

보컬로이드란?[편집]

보컬로이드(Vocaloid)는 2003년 야마하 주식회사가 개발한 음성 합성 소프트웨어이다. 가사(혹은 발음)와 멜로디를 입력하여 악곡의 보컬을 만들 수 있다. 보컬로이드(Vocaloid)라는 단어는, 사람이 노래 부르는 것을 이르는 보컬(Vocal)과, 인간과 닮은 모습을 하고 행동을 하는 로봇(또는 지적 생명체)을 이르는 안드로이드(Android)의 합성어이다. 엄밀히 말해 보컬로이드는 본디 야마하가 개발한 엔진만을 칭하는 것이나, 현재는 라이브러리의 개념까지 뭉뚱그려서 표현한다.

라이브러리(Library)는 호스트 프로그램인 보컬로이드 엔진에서 작동하는 음원으로, 보컬로이드 엔진이 음성 합성을 하는 재료를 제공한다. 성우(CV, Character Voice)가 녹음한 여러가지 발음 파일로 구성돼 있다. 라이브러리의 종류에 따라 음색, 발음 특색이 모두 다르며, 이는 성우가 다르기 때문이다. ('CV01 하츠네 미쿠'에 붙는 CV는 성우가 아닌 Crypton Vocaloid의 약자다) 각각의 라이브러리들은 모두 고유의 컨셉과 캐릭터 기획에 맞춰서 CV를 선정하고, 녹음하게 된다. 때문에 보컬로이드 라이브러리는 단순한 '데이터 파일' 뿐만 아니라 '캐릭터 성'도 지니게 된다. 캐릭터 성은 크립톤 퓨처 미디어의 초대 보컬로이드 MEIKO부터 시작하였으나 본격적인 캐릭터 성은 하츠네 미쿠부터 시작되었다.

VOCALOID는 어디까지나 음악 소프트웨어이기때문에 회사에서 의인화 시키고 음원을 내는 사이버 가수와는 큰 차이가 있다.

음성 합성 원리[편집]

프로그래머가 아닌 이상 정확한 합성 원리는 알려지지 않았으나, 유사 프로그램인 우타우와 메커니즘이 비슷하다고 알려져 있다.

노래에 사용되는 어떠한 하나의 음은 '자음부'와 '모음부' 두 부분으로 나눌 수 있다. 자음부는 10KHz 이상의 복잡한 노이즈를 포함하고 있어서, 사람이 '자음'을 인식할 수 있게 하는 부분이다. 반면 모음부는 10KHz 아래의 일정한 간격으로 나열된 배음(Overtone)을 포함하고 있어, 사람이 '음높이'와 '모음'을 인식할 수 있게 하는 부분이다. 모음부에서 각각의 배음들은 모음과 사람 고유의 음색에 따라 크기가 조금씩 다른데, 이를 배음 구조라고 한다. 보컬로이드 라이브러리마다 음색이 다른 이유는 배음 구조가 다르기 때문이다.

보컬로이드 라이브러리에는 수 십 개의 발음들이 녹음돼 있다. 이 발음들은 보컬로이드 에디터 상의 어떠한 발음 기호와 대응돼 있다. 보컬로이드 에디터는 입력받은 명령어에 따라서 녹음된 파일을 변형하여 출력한다. 파라미터의 VEL 수치는 자음부의 발음 속도를 결정하며, BRI, OPE, GEN 등은 모음부의 배음 구조를 바꾼다. 모음부는 반복되는 어떠한 파형이기 때문에, 원래 녹음된 파일의 길이와 관계없이 입력받은 길이대로 발음을 할 수 있다. 배음 구조를 안다면 음 높이가 달라지더라도, 같은 규칙으로 음을 쌓으면 되기 때문에, 원래 녹음된 파일의 음높이와 관계없이 새로운 음높이로 발성할 수 있다.

또한 음과 음이 이어지는 구간에서 자연스러운 연결 처리를 할 수 있도록 '연속음'이라는 발음 파일이 존재하며, 이는 어떠한 모음에서 다른 모음으로 이동할 때 변하는 배음 구조를 담고 있다. 원래 재생되고 있던 모음부의 성분과 앞으로 발음 될 모음부의 성분을 연결해주는 구간을, 음과 음 사이에 첨가하는 것이 연속음의 원리이다. 때문에 연속음이 부드럽게 작동하기 위해서는, 단일음의 모음부 배음 구조와 연속음의 해당 부분 배음 구조의 차이가 작아야 한다.

버전[편집]

Vocaloid 1[편집]

첫 버전은 성능도 조악했고, 사용자의 편의도 전혀 고려하지 않았다. 파라미터는 현재 버전의 보컬로이드보다 엄청나게 많았으며 대부분은 건드려도 차이를 거의 느끼지 못하는 수준이다.

Vocaloid 2[편집]

현재의 보컬로이드 디자인의 어머니 정도 되는 프로그램. 사용자가 사용하기 매우 편해졌다. 인터페이스가 Vocaloid 1에 비해 매우 개선되었으며, 보컬로이드 소프트웨어를 사용하기 어려워 했던 보컬로이드 사용자들도 보다 더 쉽게 다가갈 수 있게 되었다.

Vocaloid 3[편집]

Vocaloid 3 제품은 Vocaloid 2와 달리, 라이브러리와 호스트 프로그램을 분리하였다. 따라서 구매자들은 같은 프로그램을 위해서 중복 과금을 하는 일이 사라졌고, 이전 버전을 불러올 수 있게 되어 호환성이 높아지게 되었다. 또한 DAW(Digital Audio Workstation, 음악 작업을 할 수 있는 프로그램)에서 사용하는 인터페이스와 비슷하게 기능을 개선하였다. (Quantize 등) 가장 큰 변화라면, 지원하는 언어가 많아졌다는 것. 인터페이스는 Vocaloid 2와 달라진 것은 없으며 큰 성능향상은 없었으나, Vocaloid 3 이후로는 반주를 불러올 수 있게 되어 전 버전보다 더욱 편하게 작업이 가능하다. 참고로 Vocaloid 2 라이브러리는 Vocaloid 3 에디터와 연동 가능하다.

그러나 예정된 발매날짜를 연기하면서 개발을 계속 하다가 나온 것으로 보아, 불완전한 상태에서 프로그램이 출시가 된 것으로 보인다. 때문에 온갖 에러와 버그 및 튕김 현상으로 악명높았으며 매우 불안정하였다. 이에 모 누리꾼은 "대학생이 과제 제출용으로 만든 수준의 프로그램"이라고 폄하하였다.

Vocaloid 4[편집]

Vocaloid 4는 Vocaloid 3에 신기능을 추가한 것이다. 하위 라이브러리를 섞어 새로운 목소리를 만들 수 있는 크로스 신서시스(다만 상위 라이브러리가 같아야만 사용 가능하다. 예를 들어, Megpoid_Power와 Megpoid_Native는 크로스 신서시스가 가능하지만, Megpoid_Power와 IA_ROCKS는 크로스 신서시스가 불가능하다.) 떨리는 목소리를 낼 수 있는 그로울, 피치 렌더링, 피치 스냅 모드, 리얼타임 레코드(Editer for Cubase에서만 가능) 등이 추가되었다. 이 중 크로스 신서시스와 그로울은 많은 팬들에게 호평을 받고 있다. Vocaloid 3와 같은 vsqx파일을 사용한다. 2014년 12월 17일에 Vocaloid 4 Editer, Vocaloid 4 Editer for Cubase, VY1의 V4버전이 동시에 발매되었다. 자세한 것은 http://www.vocaloid.com/vocaloid4/ (공식사이트)참고.


지나치게 세밀한 조교를 할 경우 메모리 점유율이 폭발적으로 증가한다. 최신버전에서 문제가 해결되었다.

Native Instruments사의 오디오 인터페이스 Komplete Audio 6 드라이버와 심각한 충돌을 일으키며, 이는 오디오 드라이버를 먼저 설치하고 보컬로이드 엔진을 나중에 설치함으로서 해결할 수 있다. 다른 프로그램과의 충돌 사례가 있다면 추가바람.

최근에는 큐베이스용 호스트 프로그램(에디터)가 개발되었다고 한다. 자세한 것은 보컬로이드 스토어를 찾아보길 바란다.

Vocaloid 3의 여러가지 버그에 관해 조교러 김치맨이 블로그에 포스팅을 하고 있으므로, 숙련자들은 필히 구독을 하자. 김치맨의 블로그