Theo VentureBea, người đứng đầu bộ phận nghiên cứu AI của Duolingo - Burr Settles - chia sẻ trong một cuộc phỏng vấn tại Hội nghị thượng đỉnh AI tại London: “Phần cốt lõi trong chiến lược AI của chúng tôi là tối ưu hóa trải nghiệm người với người”.
Duolingo là một ứng dụng đa nền tảng, nơi người dùng có thể học ngôn ngữ miễn phí. Họ cũng có thể phải trả 7 USD/tháng cho dịch vụ cao cấp hơn gồm loại bỏ quảng cáo, cung cấp quyền truy cập ngoại tuyến và những quyền lợi khác. Thông qua các bài tập dạng trò chơi và các lớp học quy mô nhỏ, bất kỳ ai cũng có thể học đọc, nghe và nói bằng rất nhiều ngôn ngữ khác nhau.
Duolingo là một ứng dụng AI vào dạy ngôn ngữ. |
Thị trường học ngôn ngữ trực tuyến toàn cầu đã đạt được mức 9 tỷ USD vào năm 2018, theo Verified Market Research (Nghiên cứu thị trường được xác minh), và có thể đạt hơn 20 tỷ USD vào năm 2026. Trong bối cảnh đó, Duolingo đã đầu tư vào AI và học máy để tự động tạo ra những bài học thu hút hơn bằng cách điều chỉnh chúng cho từng cá nhân – theo cách mà một người gia sư có thể làm.
Dữ liệu
Sau một thời gian làm nghiên cứu khoa học sau tiến sĩ tại Đại học Carnegie Mellon, Settles gia nhập Duolingo vào năm 2013 với tư cách là kỹ sư phần mềm, phụ trách từ mặt front-end đến back-end (các quy trình sử dụng các ngôn ngữ để thiết kế và xây dựng các trang web hoặc ứng dụng web). Settled đã chọn gia nhập Duolingo thay vì các công ty lớn bởi vì tiềm năng mà ông thấy ở vị trí này.
Settles chia sẻ: “Mối quan tâm của tôi là ở 'giao điểm' của ngôn ngữ, AI trong công nghệ và khoa học nhận thức. Cần lưu ý rằng không có nhiều công việc rơi vào 'ngã ba' như vậy".
Ngay sau khi gia nhập Duolingo, Settles và nhóm bắt đầu tìm cách để biến cấu tạo mô hình học tập của Duolingo, vốn được dựa trên các thuật toán lên lịch thẻ flash từ những năm 70. Một trong những thách thức theo ông là có rất ít nghiên cứu về việc tận dụng AI cho giáo dục ở bất kỳ quy mô thực tế nào. Settles nói: “Có rất ít tài liệu nghiên cứu và có hai vấn đề chính với số tài liệu này. Một là chúng giống những nghiên cứu trong phòng thí nghiệm, với khoảng 30 người và hầu hết là sinh viên đại học. Và đó là một tập hợp rất khác so với 300 triệu người từ khắp nơi trên thế giới với những nền tảng kiến thức khác nhau, những người có thể sử dụng Duolingo.
Những gì Duolingo đã làm là thu thập một lượng lớn dữ liệu học tập có thể được sử dụng để phát triển các mô hình và thuật toán mới từ đầu. “Một phần lý do tôi nhận công việc là số lượng dữ liệu, loại dữ liệu và tính duy nhất của dữ liệu”, Settles nói. "Chúng tôi đã sử dụng phương pháp phỏng đoán và đang thu thập dữ liệu về các bài tập mà học sinh đã làm đúng, làm sai và đã bao lâu kể từ lần cuối họ nhìn thấy nó trong ứng dụng. Và vì chúng tôi đã theo dõi những thống kê đó, chúng tôi nghĩ "Tại sao không tạo ra các mô hình dự đoán, thay vì tự làm điều đó?".
Burr Settles, người đứng đầu bộ phận nghiên cứu AI của Duolingo. Ảnh: VentureBea. |
Nửa vòng đời tri thức (khoảng thời gian mà 1/2 kiến thức học được bị quên lãng)
Duolingo đã phát triển các mô hình thống kê và học máy của riêng mình, đồng thời kết hợp các kỹ thuật học tập đã được thử và kiểm tra như lặp đi lặp lại đều đặn để tối ưu hóa và cá nhân hóa các bài học.Việc lặp lại các bài học ngắn xen các khoảng nghỉ cố định được cho là tốt hơn nhồi nhét cùng một lượng thông tin trong một khoảng thời gian ngắn. Liên quan đến điều này là hiệu ứng trễ (lag effect), theo đó người dùng có thể cải thiện nhiều hơn nếu khoảng cách giữa các buổi thực hành được tăng dần đều.
Nhưng vấn đề chính với các chương trình được đưa vào giảng dạy tự động thay con người là người học khác nhau rất nhiều - tùy thuộc vào kiến thức hiện có của họ về ngôn ngữ và hoàn cảnh cá nhân hoặc tính cách. Và các mô hình học máy không tính đến bản chất khác nhau của cá nhân. Vì thế mô hình thống kê Duolingo ra đời – hay còn được gọi là mô hình “Hồi quy nửa vòng đời”. Nó phân tích các mẫu lỗi của hàng triệu người học ngôn ngữ để dự đoán “nửa vòng đời” cho mỗi từ trong bộ nhớ dài hạn của một cá nhân. "Khi chúng tôi đưa nó vào hoạt động, chúng tôi đã thấy sự tham gia của người dùng tăng lên 12%”, Settles thông tin.
Khái niệm nửa vòng đời (half-life hay chu kì bán rã) thường được sử dụng trong vật lý để mô tả thời gian cần thiết để một đại lượng giảm xuống một nửa giá trị ban đầu. Trong việc học ngôn ngữ, điều này có thể mô tả việc ghi nhớtừ vựng hoặc kiến thức ngữ pháp trong não của bạn. Nếu một nửa vòng đời là một ngày và bạn không thực hành một ngôn ngữ mới trong một ngày, có 50% khả năng bạn sẽ quên bài học. Hồi quy nửa vòng đời có nghĩa là đi vào bên trong bộ não một người, tìm ra những gì họ biết hoặc không biết, và sau đó nhắm đến những tài liệu khóa học phù hợp.
“Nếu bạn có hai người, một người chưa bao giờ học tiếng Pháp trước đây và một người khác đã học bốn năm trung học học tiếng Pháp, có thể họ sẽ sớm thể hiện những điểm khác nhau về bài làm đúng và sai”. Người đã có nền tảng sẽ ít mắc lỗi hơn.
Các phương pháp được sử dụng để tập trung vào nội dung - như "hồi quy nửa vòng đời" để vào sâu bên trong bộ não của học sinh theo cách mà một giáo viên có thể làm - rất quan trọng. Nhưng bản thân nội dung cũng quan trọng không kém, và ở đây Duolingo cũng đang chuyển sang AI - để giúp xây dựng chương trình giảng dạy phù hợp.
“Có hàng triệu từ trong tiếng Anh và có thể 10.000 từ được sử dụng với tần suất cao - bạn dạy chúng theo thứ tự nào? Làm thế nào để bạn xâu chuỗi chúng lại với nhau? Chúng tôi đã xây dựng các hệ thống để giúp người sáng tạo nội dung điều chỉnh tài liệu cho người mới bắt đầu, trung cấp và nâng cao”.
Một thách thức nữa là trong khi chỉ có 40% người dùng Duolingo đang học tiếng Anh, hầu hết các dữ liệu sư phạm mà công ty sử dụng để đào tạo các hệ thống AI của họ được phát triển cho tiếng Anh. Vì vậy, Duolingo đã thực sự phải áp dụng chúng lên các ngôn ngữ khác. Trong giới AI, phương pháp này được biết đến là "transfer learning" (chuyển giao học hỏi).
Tuyển dụng
Rõ ràng có một sự thiếu hụt kỹ năng AI, mặc dù nguồn tài năng này đang tăng, và nhiều công ty công nghệ lớn đang đấu tranh để có được các công ty khởi nghiệp AI đầy triển vọng. Cuộc khủng hoảng tài năng này là thử thách của Duolingo trong vài năm qua, đặc biệt là các kỹ năng cụ thể. Nghiên cứu AI mà công ty đang thực hiện vượt qua một loạt các ngành học và là giao thoa giữa tâm lý học và khoa học, bên cạnh ngôn ngữ và ngôn ngữ học.
"Chúng tôi muốn có nhiều nhân tài hơn ở giao điểm của ngôn ngữ, AI và khoa học nhận thức”, Settles nói. “Yêu cầu của chúng tôi cũng rất cao. Gần đây tôi đã xem xét các con số: chưa đến một nửa những người ứng tuyển vào công việc AI có thể hoàn thành mọi việc.”
Settles nói thêm rằng công ty đã phát hiện ra một sự gia tăng nhỏ về lợi ích từ những người có trình độ trong 18 tháng hoặc lâu hơn, bao gồm cả những người nộp đơn từ các công ty công nghệ khác và từ các học viện.
“Có nhiều người từ các công ty công nghệ lớn hơn và chúng tôi cũng đang tuyển dụng rất nhiều người xong chương trình tiến sĩ - chủ yếu là vì họ cởi mở hơn, và chưa có những lối mòn suy nghĩ”, Settles bổ sung.
Tạo ra trải nghiệm hấp dẫn
Một trong những thách thức lớn nhất với việc dạy một ngôn ngữ từ xa là khó có thể tạo ra một trải nghiệm hấp dẫn và đủ phong phú để giữ cho người học quay trở lại. Trong nỗ lực thúc đẩy sự tham gia của học viên, vào năm 2016, Duolingo đã đưa ra các bot để giúp dạy ngôn ngữ thông qua các cuộc hội thoại dựa trên văn bản tự động bên trong ứng dụng của mình.
Nhiều nhân bot khác nhau được thiết kế để phản hồi với một loạt các câu trả lời có thể có và người dùng có thể nhấn nút “Giúp tôi trả lời” nếu họ bị vướng mắc. Về mặt lý thuyết, các bot sẽ càng thông minh hơn khi chúng càng được sử dụng nhiều.
Hiện tại các bot của Duolingo dường như đang bị gián đoạn tạm thời, nhưng kiểu học này có thể nâng việc dạy ảo lên cấp độ tiếp theo. Những phát triển gần đây của các trợ lý giọng nói AI, như Alexa của Amazon và Trợ lý Google, có thể mở ra những cơ hội hoàn toàn mới cho người học ngôn ngữ. Hãy tưởng tượng nếu nói rằng, “Hey Alexa, tôi đã sẵn sàng để học tiếng Pháp” có thể khởi động phần tiếp theo của giáo dục ngôn ngữ? Và nếu Trợ lý Google có thể sửa lỗi phát âm và ngữ pháp của bạn chỉ bằng cách lắng nghe bạn?
Ngoài ra, người dùng có thể đeo kính thực tế ảo để vào môi trường lớp học ảo, và thật dễ dàng tưởng tượng việc học một ngôn ngữ mới sẽ hấp dẫn hơn bao nhiêu.
Trong khi Duolingo không tiết lộ bất kỳ kế hoạch nào xung quanh việc tích hợp trợ lý giọng nói thông minh hoặc công nghệ thực tế ảo, công ty đã cam kết tiếp tục cá nhân hóa nội dung và đưa yếu tố con người vào học tự động.
“Nếu bạn nghĩ về cách vận hành của những giáo viên giỏi, thì có ba tài sản mà họ có. Một người là họ biết rất rõ nội dung, và thứ hai là họ có cách xâm nhập vào trong đầu bạn, tìm ra những gì bạn biết và những gì bạn không biết. Và thứ ba là tìm ra những cách hấp dẫn để thu hút bạn với tài liệu học ở cấp độ của bạn".
“Hồi quy nửa vòng đời là một ví dụ về việc thâm nhập vào đầu bạn, tìm ra một mô hình trí tuệ về những gì bạn biết, những gì bạn đang mắc phải và nhắm mục tiêu vào tài liệu đó”, ông nói. “Còn có rất nhiều điều chưa được khám phá. Tôi nghĩ rằng có rất nhiều cơ hội để AI tạo ra những trải nghiệm học tập mới và hấp dẫn.”
>> FPT tham gia Ngày hội Trí tuệ nhân tạo Việt Nam
Thủy Minh
Ý kiến
()