Chúng ta

StreamVoice AI: Khi công nghệ FPT ‘thổi hồn’ cảm xúc vào thuyết minh phim tự động

Thứ năm, 5/2/2026 | 13:32 GMT+7

Không còn là giọng đọc "chị Google" đều đều vô cảm, StreamVoice AI - giải pháp thuyết minh bằng AI do đội ngũ FPT Play phát triển, đang tạo ra một cuộc cách mạng trong trải nghiệm xem phim nhờ khả năng tự động thuyết minh với ngữ điệu tự nhiên và đầy cảm xúc như người thật.

Thuyết minh phim từ lâu đã là nhu cầu thiết yếu tại Việt Nam, đặc biệt với nhóm khán giả lớn tuổi, trẻ em hay người khiếm thị - những người gặp rào cản lớn khi phải đọc phụ đề chạy liên tục trên màn hình. Tuy nhiên, bài toán về chi phí và thời gian sản xuất luôn là thách thức lớn với các nhà cung cấp nội dung.

Từ thực tế đó, StreamVoice AI ra đời. Sản phẩm đã vận hành thực tế trên nền tảng FPT Play, giải quyết trọn vẹn bài toán cân bằng giữa "tốc độ công nghiệp" và "cảm xúc nghệ thuật", đặc biệt cho các mảng phim simulcast - chiếu song song.

-8978-1770264010.jpg

Nhóm phát triển sản phẩm StreamVoice AI, gồm anh Huỳnh Lưu Vĩnh Phong (trái), chị Trần Minh Anh và anh Nguyễn Ngọc Tiến.

Tiên phong đưa AI "xem phim" cùng khán giả

Hiện, FPT Play là đơn vị tiên phong ứng dụng AI tự động thuyết minh trong OTT (cung cấp nội dung số qua Internet) tại Việt Nam. Với StreamVoice AI, điểm khác biệt lớn nhất và là lợi thế so với các giải pháp Text-to-Speech (chuyển văn bản thành giọng nói) thông thường trên thị trường là yếu tố cảm xúc.

Anh Nguyễn Ngọc Tiến - Trưởng phòng Big Data, FPT Play, Tập đoàn FPT, phụ trách sản phẩm StreamVoice AI cho biết: “Điểm sáng tạo của giải pháp nằm ở trải nghiệm cảm xúc. Trên thị trường, mô phỏng cảm xúc bằng AI là bài toán rất khó và các giải pháp hiện có gần như chưa đạt được yếu tố này. StreamVoice AI vượt qua rào cản đó khi AI không chỉ đọc chữ, mà kiểm soát nhịp điệu, cao trào và cảm xúc theo từng cảnh vui buồn giận dữ… của phim, mang lại trải nghiệm xem trọn vẹn cho nhiều tệp khán giả”.

Đáng tự hào hơn, đây là sản phẩm “Made in Vietnam” 100%, được phát triển hoàn toàn bởi đội ngũ kỹ sư FPT. Việc làm chủ hoàn toàn công nghệ giúp StreamVoice AI thấu hiểu sâu sắc ngữ điệu và văn cảnh bản địa - điều mà các giải pháp ngoại nhập khó bắt kịp.

Về mặt công nghệ, sản phẩm là sự kết hợp giữa xử lý ngôn ngữ tự nhiên (NLP) và phân tích âm thanh. AI không chỉ đọc chữ, mà còn "nghe" âm thanh gốc để nhận diện cao độ, nhịp điệu và cảm xúc của nhân vật, từ đó sinh ra giọng thuyết minh khớp đến từng khung hình.

Nhanh gấp 144 lần

Sức mạnh của StreamVoice AI nằm ở quy trình vận hành cực kỳ tinh gọn. Đội ngũ nội dung chỉ cần đưa vào hai dữ liệu: Phụ đề và âm thanh gốc. AI sẽ tự động xử lý toàn bộ phần còn lại để trả ra file thuyết minh hoàn chỉnh.

Những con số thực tế đã chứng minh hiệu quả vượt trội của sản phẩm. Tốc độ thần tốc: Thời gian hoàn thiện thuyết minh một tập phim giảm từ 1,5 ngày xuống còn 15 phút, tức nhanh hơn 144 lần. Điều này giúp FPT Play chiếm ưu thế tuyệt đối trong mảng phim chiếu song song (Simulcast) khi có thể tung ra bản thuyết minh gần như cùng lúc với phụ đề.

Tiết kiệm chi phí: StreamVoice AI giúp tiết kiệm khoảng 1,4 tỷ đồng/năm cho chi phí sản xuất phim mới. Đặc biệt, nếu áp dụng cho kho nội dung cũ lên tới 60.000 tập phim, con số tiết kiệm có thể lên tới 15 tỷ đồng (giảm 75% chi phí).

Tăng trưởng người xem: Sự tiện lợi đã kích thích nhu cầu khán giả, đưa tốc độ tăng trưởng lượt xem trung bình ngày đạt mức ấn tượng 296,8%.

-3778-1770264010.jpg

Đội ngũ Big Data thuộc FPT Play.

Tầm nhìn thương mại hóa toàn cầu

Không chỉ phục vụ nội dung nội bộ, StreamVoice AI đang được định hướng trở thành một sản phẩm thương mại hóa dưới dạng SaaS (Phần mềm như một dịch vụ), dự kiến chính thức ra mắt thị trường vào quý IV/2026.

Anh Nguyễn Ngọc Tiến cho biết, đội ngũ đang phát triển sản phẩm theo các hướng mũi nhọn, từ: mở rộng thư viện giọng với đa dạng hóa vùng miền, độ tuổi và giới tính; lồng tiếng nhân vật (AI Dubbing), nâng cấp từ thuyết minh một giọng sang lồng tiếng cho từng nhân vật, tiệm cận trải nghiệm truyền thống cùng các tính năng sẽ được nâng cấp liên tục.

"Chúng tôi nhìn thấy cơ hội rất lớn từ thị trường quốc tế. StreamVoice AI sẽ phát triển song song ba hướng: B2B cho các đài truyền hình/OTT; B2C cho các nhà sáng tạo nội dung (YouTuber, TikToker) và đặc biệt là thị trường FAST Channel (truyền hình trực tuyến miễn phí có quảng cáo) đang bùng nổ toàn cầu. Với thế mạnh nhanh - rẻ - xử lý khối lượng lớn, chúng tôi kỳ vọng sản phẩm sẽ mang về doanh thu hàng chục tỷ đồng mỗi năm cho FPT", anh Tiến nhấn mạnh.

Với sự đầu tư bài bản về con người (đội ngũ chuyên gia AI Speech), công nghệ lõi (Speech AI end-to-end) và hạ tầng GPU mạnh mẽ, StreamVoice AI hứa hẹn không chỉ là công cụ đắc lực của FPT Play mà còn là "vũ khí" đưa công nghệ nội dung số Việt Nam vươn ra biển lớn.

Nam Dung

Ý kiến

()