eSpeak Ứng dụng
eSpeak NG là một phần mềm mã nguồn mở tổng hợp văn bản thành giọng nói gọn nhẹ cho Linux, Windows, Android và các hệ điều hành khác. Nó hỗ trợ hơn 100 ngôn ngữ và giọng nói. Nó dựa trên động cơ eSpeak được tạo ra bởi Jonathan Duddington.
eSpeak NG sử dụng phương pháp "tổng hợp hình thức". Điều này cho phép cung cấp nhiều ngôn ngữ trong kích thước nhỏ. Giọng nói rõ ràng và có thể được sử dụng với tốc độ cao, nhưng không tự nhiên hoặc mượt mà như các bộ tổng hợp lớn hơn dựa trên các bản ghi âm giọng nói của con người. Nó cũng hỗ trợ tổng hợp hình thức Klatt, và khả năng sử dụng MBROLA như một bộ tổng hợp giọng nói phía sau.
Các tính năng:
- Bao gồm nhiều Giọng nói khác nhau, với các đặc điểm có thể được thay đổi.
- Có thể xuất giọng nói dưới dạng tệp WAV.
- Hỗ trợ SSML (Ngôn ngữ Đánh dấu Tổng hợp Giọng nói) (không đầy đủ), và cũng hỗ trợ HTML.
- Kích thước gọn nhẹ. Chương trình và dữ liệu của nó, bao gồm nhiều ngôn ngữ, tổng cộng khoảng vài Mbyte.
- Có thể được sử dụng như một giao diện cho giọng nói diphone MBROLA. eSpeak NG chuyển đổi văn bản thành các âm vị với thông tin về cao độ và độ dài.
- Có thể dịch văn bản thành mã âm vị, do đó có thể được điều chỉnh như một giao diện cho một động cơ tổng hợp giọng nói khác.
- Tiềm năng cho các ngôn ngữ khác. Một số ngôn ngữ đã được bao gồm ở các giai đoạn khác nhau của tiến trình. Sự giúp đỡ từ người bản ngữ cho những ngôn ngữ này hoặc ngôn ngữ khác là rất hoan nghênh.








