Tin chiều 13.06.2019: Translatotron của Google có thể dịch bài phát biểu mà vẫn giữ nguyên giọng nói của bạn

13-06-2019

IDEAS+ - Các nhà nghiên cứu đã tạo một mạng lưới thần kinh để vẽ lại bản in giọng nói từ ngôn ngữ này sang ngôn ngữ khác.

 

Google AI vừa công bố kết quả nghiên cứu mới nhất của mình trong một thử nghiệm dịch lời nói thành giọng nói của chính bạn, nó được gọi là Translatotron.

"Google Dịch chia bài phát biểu của bạn thành các từ dựa trên văn bản, thực hiện dịch văn bản thành văn bản và sau đó phát lại văn bản đã dịch bằng TTS (tổng hợp văn bản thành giọng nói). Dịch thuật hoàn toàn mới của Google Dịch dựa trên mô hình dịch trực tiếp lời nói thành giọng nói. Nói cách khác, nó trực tiếp dịch đầu vào được lấy thành lời nói và phát lại bằng cách sử dụng một mô hình trình tự theo trình tự chú ý duy nhất, do đó cung cấp tốc độ suy luận nhanh hơn, tự nhiên tránh các lỗi ghép giữa nhận dạng và dịch thuật, khiến cho việc giữ giọng nói trở nên đơn giản người nói ban đầu sau khi dịch và xử lý tốt hơn những từ không cần dịch", Google cho biết.

Tuy kết quả không hoàn hảo, nhưng bạn có thể nghe cách Google dịch có thể giữ được giọng nói và âm điệu của loa gốc. Nó có thể làm điều này bởi vì nó chuyển đổi đầu vào âm thanh trực tiếp thành đầu ra âm thanh mà không cần bất kỳ bước trung gian nào. Ngược lại, các hệ thống tịnh tiến truyền thống chuyển đổi âm thanh thành văn bản, dịch văn bản và sau đó tổng hợp lại âm thanh, làm mất các đặc điểm của giọng nói gốc trên đường đi.

Hệ thống mới, được đặt tên là Translatotron, có ba thành phần, tất cả đều xử lý phổ âm thanh của người nói - ảnh chụp nhanh về tần số được sử dụng khi âm thanh đang phát, thường được gọi là voiceprint. Thành phần đầu tiên sử dụng mạng thần kinh được đào tạo để ánh xạ phổ âm thanh trong ngôn ngữ đầu vào sang phổ âm thanh trong ngôn ngữ đầu ra. Thứ hai chuyển đổi quang phổ thành một sóng âm thanh có thể được phát. Thành phần thứ ba sau đó có thể đưa các đặc điểm giọng nói gốc của loa trở lại vào đầu ra âm thanh cuối cùng.

Cách tiếp cận này không chỉ tạo ra các bản dịch nhiều sắc thái hơn bằng cách giữ lại các tín hiệu phi ngôn ngữ quan trọng, mà về mặt lý thuyết, nó cũng nên giảm thiểu lỗi dịch thuật, bởi vì nó chuyển dịch ít bước hơn.

Translatotron hiện là một thử nghiệm. Trong quá trình thử , các nhà nghiên cứu đã thử nghiệm hệ thống chỉ với bản dịch từ tiếng Tây Ban Nha sang tiếng Anh.

"Mặc dù Google hiện đang sở hữu một mô hình dịch thuật mới, nhưng nó vẫn chưa sẵn sàng để kết hợp nó vào Google Dịch và các công cụ liên quan khác. Hệ thống mới đang tụt lại phía sau về điểm BLEU, nghĩa là bản dịch chưa đủ chính xác. Về mặt tích cực, mô hình mới vẫn giữ được giọng nói tự nhiên của người dùng ngay cả sau khi dịch vì nó không sử dụng TTS cho đầu ra," báo cáo của Digit.in.


Duy Khang - IDEASPLUS.VN


 

Content 14