네이버 클로바 더빙을 사용해 봅시다

클로바 더빙은 지난 2월(2020년) 네이버에서 출시한 AI 음성 더빙 솔루션이다. 네이버의 AI 어시스턴트 클로바 Clova 의 음성 합성 기술을 기반으로 제작된 일종의 텍스트 투 스피치 Text to Speech 서비스로, 유튜브나 브이로그 동영상 제작 시, 전문 성우의 도움 없이도 준수한 수준의 더빙물을 만들 수 있다.

클로바 더빙을 적용해 만든 게임 트레일러 영상 – 올해의 게임 시뮬레이터

이 서비스는 비상업적 용도 / 동영상 / 클로바 더빙 사용을 영상물에 표시 하는 조건으로 무상으로 사용 가능하다. 상업적 용도의 사용은 별도 제휴 신청 및 허가가 필요하다.

다양한 종류의 디폴트 음성(남성 및, 여성 그리고 아이)을 지원하며, 음성의 높낮이나 속도를 조절하여 이를 커스터마이징 할 수 있다(하지만 대자연의 원칙인 튜닝의 끝은 순정이란게 여기서도 적용되는 듯 하다).

이용을 위해선 네이버 로그인이 필요하다. 프로젝트는 자유롭게 생성 가능하지만, 프로젝트 당 최대 5분이라는 분량 제약이 존재하기 때문에 좀 불편한 편. 자체 에디터는 기본 기능만 제공하고 있기 때문에 대부분 작업은 음성 더빙 파일을 받아서 별도 에디터에서 하는 편을 추천한다.

클로바 더빙을 사용한 영상물 – 게임 회사 이야기: 오리진 시스템즈 편

음성은 상당히 깔끔하다. 기존의 텍스트 투 스피치 제품들 보다는 확실히 더 자연스러운 음성을 보여주지만, 그래도 사람이 느끼기에 어색한 경우가 많은 편.

지금까지 작업하면서 얻은 몇 가지 팁을 공유하자면 아래와 같다.

  • 생성 문장이 길면, 길 수록 더 자연스러워진다. 단어 하나 식으로 입력하면 합성음의 어색함이 바로 나온다.
  • 쉼표(,)와 마침표(.) 구분이 꽤 정확하기 때문에, 이를 잘 활용하는게 좋다. 문장이 길면 자연스러운 대신, 좀 쉬지않고 말하는 경우가 자주 있는데 때문에 쉼표를 적극 사용해야 한다.
  • 문장 끝을 쉼표로 하면 문장의 끝음이 올라간다. 반대로 마침표를 찍으면 문장의 끝음이 내려간다.
  • 영어의 경우, 원래 철자를 입력하는 것 보다 한글 음역을 쓰는 편이 좋다. 영어 단어 인식이 아직 오락가락 하는 경우가 있기 때문이다.
  • 문장을 통으로 더빙 하는 것 보다, 적절히 쪼개서 더빙을 하는 것이 영상 편집에 적용하기에 좀 더 수월하다.
클로바 더빙을 사용한 영상물 – 게임 회사 이야기: 마이크로 프로즈 편

기존 제품들에 비해 확실히 깔끔하고 꽤 인상적인 품질을 보여주긴 하지만, 전문 성우를 써야하는 경우의 대안으로는 아직 부족하다. 하지만, 적당한 품질에서 만족한다면 충분히 쓸 만한 서비스이다.