Chúng ta

Máy của IBM nghe hiểu ‘ngang con người’

Thứ hai, 13/3/2017 | 08:32 GMT+7

Với tỷ lệ nhận diện sai chỉ 5,5%, công nghệ của IBM khiến giới khoa học ngạc nhiên khi có thể nghe hiểu như con người.

Theo Business Insider, tuần qua, IBM đã ghi dấu mốc lớn trong lĩnh vực trí thuệ nhân tạo khi phần mềm của hãng nghe hiểu chuẩn đến 94,5%, tức tỷ lệ lỗi chỉ 5,5%.

Trong các đối thoại hàng ngày, tỷ lệ sai sót (bỏ lỡ/nghe nhầm) khi tai người nhận diện các câu thoại vào khoảng 5%. Vì vậy, tỷ lệ nhận diện sai 5,5% được cho là con số đáng mơ ước với phần mềm nhận diện giọng nói. Đó cũng là mục tiêu mà nhiều hãng công nghệ hướng đến, trong đó có IBM.

ibm-nhan-dien-giong-noi-2730-1489307936.

Trí tuệ nhân tạo đang trở thành xu thế mới trên thị trường công nghệ.

“Khả năng nhận diện giọng nói tốt ngang con người vẫn là một thách thức lớn, bởi lời thoại của con người, đặc biệt là trong các cuộc trò chuyện ngẫu hứng, luôn rất phức tạp khó đoán”, Julia Hirschberg, Giáo sư Khoa học máy tính ĐH Columbia (New York) nhận định.

Một năm qua, IBM đã không ngừng nỗ lực để phá vỡ kỷ lục lỗi 6,9% mà hãng đã xác lập trước đó. Dấu mốc này đã được ghi nhận khi lần đầu tiên IBM tiệm cận con số mơ ước nêu trên vào ngày 7/3: tỷ lệ mắc lỗi của phần mềm do IBM sáng tạo chỉ là 5,5%.

Để đạt được 1,4% này, công ty đã phải thay đổi nhiều khía cạnh âm vị học để phần mềm có thể bắt đúng nhiều dạng lời thoại khác nhau. Đây được coi là tín hiệu đầu tiên cho thấy trí tuệ nhân tạo có thể ‘tung hoành’ trên smartphone giống như trợ lý ảo Siri (Apple), Alexa, Google Assistant.

Các chuyên gia luôn cho rằng máy tính sẽ không thể nhận diện được một số sắc thái trò chuyện đặc biệt như tông giọng, ẩn dụ... nhưng phần mềm của IBM đã đạt được nhiều bước tiến đáng kể trong việc chép chính tả lại lời người nói.

Các thử nghiệm dành cho phần mềm nhận diện giọng nói của IBM cũng rất phức tạp. Trong bài đánh giá gần đây nhất, phần mềm được yêu cầu nhận diện những câu thoại được nói trong ngữ cảnh hằng ngày, chẳng hạn như đi mua xe, với hàng loạt từ nói lắp, những tiếng lầm bầm hay “ờ, à…” liên tục… tờ Business Insider mô tả.

IBM cho biết, tỷ lệ sai sót 5,5% thực sự là một cột mốc quan trọng trong lĩnh vực mà giới chuyên gia vẫn chưa tin là có thể bắt kịp được khả năng con người. George Saon, chuyên gia nghiên cứu của IBM, tiết lộ, các đối thủ trong ngành đang nỗ lực theo kịp thành tựu này của hãng. “Gần đây, một số đối thủ đã khẳng định đạt tỷ lệ 5,9%".

Trước đó, năm 2016, các nhà nghiên cứu của Microsoft từng khẳng định họ đã xây dựng được một máy tính có thể đánh bại cả con người về khả năng nghe hiểu. Tuy nhiên, tỷ lệ sai của phần mềm lại lên đến 6,3%, cao hơn rất nhiều so với kỷ lục mới thiết lập của IBM.

Trí tuệ nhân tạo đang trở thành xu thế mới trên thị trường công nghệ, thu hút số tiền đầu tư 8,5 tỷ USD của các hãng công nghệ hàng đầu thế giới gồm Google, Facebook, Microsoft và Baidu trong năm 2015, theo hãng cung cấp dữ liệu Quid.

Hiện tại, các nhân tài AI được đào tạo từ khoa nghiên cứu robot và học máy (machine learning là lĩnh vực của trí tuệ nhân tạo, liên quan đến việc nghiên cứu và xây dựng các kỹ thuật cho phép các hệ thống “học” tự động từ dữ liệu để giải quyết những vấn đề cụ thể) đang trở thành những đối tượng được các hãng công nghệ săn lùng.

>> Trí tuệ nhân tạo có thể tự lập trình

Chi Vy

Ý kiến

()