Là một nhạc sĩ nhưng năng khiếu ca hát chưa bao giờ là điểm mạnh của tôi, và tôi luôn ý thức rõ về giọng hát chệch tông của mình. Quyết định tìm hiểu liệu công nghệ AI có thể khắc phục vấn đề này hay không, tôi đã có được những kết quả khá thú vị và đáng để chia sẻ. Bài viết này sẽ đi sâu vào hành trình tôi thử nghiệm AI chỉnh giọng hát để khám phá tiềm năng của nó trong việc cải thiện chất lượng vocal.
Lựa chọn công cụ chỉnh sửa giọng hát AI phù hợp
Để đảm bảo không vi phạm bản quyền, tôi đã sử dụng nội dung âm nhạc gốc của mình cho thử nghiệm này. Ban đầu, tôi cân nhắc sử dụng công cụ tách nhạc nền của Lalal.ai để cô lập phần nhạc đệm và loại bỏ vocal, cũng như Voice Converter từ Kit.ai vì thư viện vocal AI phong phú của nó.
Cuối cùng, tôi quyết định chọn Audimee Free Voice Tuner để điều chỉnh giọng hát của mình. Lý do chính là vì công cụ này rất dễ sử dụng và cho phép điều chỉnh vibrato (rung) cũng như cao độ (pitch). Ngoài ra, Audimee còn có khả năng loại bỏ vocal khỏi các bản nhạc đệm, cô lập hoàn toàn bản thu vocal, và loại bỏ tạp âm/hiệu ứng nền. Về cơ bản, nó cung cấp một số mẫu giọng ca sĩ AI để bạn có thể mô phỏng giọng mình, biến nó thành một giải pháp “tất cả trong một” cho dự án này.
Đưa các công cụ AI chỉnh sửa giọng hát vào thử nghiệm thực tế
Giống như nhiều người, tôi thường cảm thấy không thoải mái khi nghe lại giọng nói của chính mình. Tuy nhiên, vì mục tiêu tiến bộ, tôi sẵn sàng đối mặt với nỗi sợ hãi đó bằng cách ghi âm một bản vocal acapella thô, thứ mà sau này sẽ được ghép với phần nhạc đệm.
Ghi âm bản vocal thô
Tôi đã ghi âm vocal của mình bằng micro condenser và sound card ngoài với phần mềm Logic Pro 11. Nếu không có các thiết bị này, bạn hoàn toàn có thể sử dụng một micro USB giá cả phải chăng và các phần mềm sản xuất âm nhạc miễn phí để đạt được kết quả tương tự.
Giao diện phần mềm Logic Pro 11 hiển thị trang sắp xếp bản thu âm vocal, minh họa quá trình sản xuất âm nhạc tại nhà.
Tôi bắt đầu với một bản vocal sạch, không hiệu ứng reverb hay bất kỳ hiệu ứng nào khác. Nghe lại bản thu thô của chính mình là một trải nghiệm khá khiêm tốn và hơi xấu hổ, điều này càng làm tôi thêm kính trọng những ca sĩ chuyên nghiệp. Chắc hẳn bạn cũng sẽ đồng ý rằng bản thu đó nghe khá tệ. Giờ là lúc để xem liệu AI có thể thực hiện nhiệm vụ dường như bất khả thi là làm cho tôi hát đúng cao độ hay không.
Áp dụng chỉnh sửa cao độ bằng AI
Đây là phần thú vị nhất. Các bước thực hiện khá đơn giản: tôi có thể ghi âm trực tiếp vào Audimee hoặc kéo và thả tệp vocal đã ghi âm của mình vào. Tôi chọn phương án thứ hai, vì nó cho phép tôi hát theo nhịp metronome và điều chỉnh âm thanh của mình trước khi nhập vào.
Tiếp theo, tôi phải chọn một mô hình vocal AI. Tôi đã chọn một tùy chọn nam có chất giọng rock tên là “Blake” để giữ lại một số đặc điểm từ giọng của mình và giữ nó trong cùng một quãng âm. Để tạo ra bản vocal đã được chỉnh sửa, tôi chỉ cần chọn tông nhạc (key) mong muốn cho tệp đã nhập và điều chỉnh thanh trượt Conversion Strength cho đến khi đạt được kết quả ưng ý.
Các chỉnh sửa vocal khác
Mặc dù công nghệ AI có thể tạo ra những điều kỳ diệu, tôi vẫn cố gắng ghi âm bản vocal gốc của mình chính xác nhất có thể về cách luyến láy, nhịp điệu và các sắc thái khác. Dù vậy, bản thu vẫn còn chênh phô ở một số chỗ, và điều này thể hiện rõ trong kết quả cuối cùng. Tôi đã xuất bản vocal của mình và phối trộn nó với bản nhạc đệm trong Logic Pro 11. Sau đó, tôi thêm hiệu ứng echo vào vocal và xuất thành tệp MP3 để trình diễn trực tuyến.
Kết quả cuối cùng và những bài học đắt giá
Đây là bản thu cuối cùng của tôi. Mặc dù ban đầu còn hoài nghi, giờ đây tôi xem AI là một công cụ có giá trị, đặc biệt đối với những người, giống như tôi, có thể không có năng khiếu ca hát bẩm sinh. Tôi thậm chí còn cân nhắc sử dụng AI trong các dự án tương lai, chủ yếu như một vocal hướng dẫn để các ca sĩ khác (có tài năng hơn) có thể hát theo.
Ngoài ra, tôi cũng đã thử bản vocal của mình với một mô hình AI nữ tên là “Nicole” vì tôi muốn thử một tông giọng hoàn toàn khác, càng khác biệt với giọng của mình càng tốt. Tôi đã điều chỉnh Pitch Shift lên 12 bán âm (một quãng tám) và điều này đã thêm một độ trong trẻo đáng ngạc nhiên cho vocal, khiến nó nghe thuyết phục hơn nhiều đối với tôi.
Một bài học quan trọng rút ra là bạn không thể mong đợi AI tạo ra phép màu. Bạn nên cố gắng hết sức để hát đúng nhịp, gần đúng cao độ nhất có thể, và có lẽ quan trọng nhất là hát với sự truyền cảm. Chỉ khi đó, “phép màu” của AI mới có thể phát huy tác dụng thực sự và mang lại kết quả chuyên nghiệp.
Chắc chắn bạn sẽ đồng ý rằng bản thu cuối cùng còn xa mới đạt đến sự hoàn hảo, nhưng với chất liệu gốc ban đầu, tôi thực sự rất ấn tượng với những gì AI đã làm được. AI đã chứng minh khả năng tuyệt vời trong việc hỗ trợ và cải thiện chất lượng âm thanh, mở ra nhiều cơ hội cho những người đam mê âm nhạc.