Chúng ta

Tiến sĩ 'bắt' máy phải hiểu người Việt

Thứ sáu, 25/11/2016 | 08:51 GMT+7

Trí tuệ nhân tạo đã có những bước tiến xa trong việc phân tích hình ảnh và các ngôn ngữ phổ biến như tiếng Anh, Pháp. Nhưng với một ngôn ngữ có độ phức tạp cao như tiếng Việt, các bộ não máy không dễ để hiểu được con người đang muốn gì.  

Bằng việc phát triển một hệ thống có khả năng phân loại bình luận của người dùng về các sản phẩm là tích cực hay tiêu cực, TS. Phạm Quang Nhật Minh đã tạo ra công cụ có khả năng xử lý ngôn ngữ tiếng Việt chính xác chưa từng thấy. 

Dự án của TS. Nhật Minh, nghiên cứu sinh tại Viện Nghiên cứu công nghệ FPT vừa lọt Top 3 tại Hội thảo xử lý ngôn ngữ tiếng Việt (Workshop Vietnamese Language and Speech Processing), nằm trong khuôn khổ Hội nghị quốc tế lần thứ 12 về Công nghệ thông tin và Truyền thông (IEEE-RIVF) lần đầu tiên được tổ chức tại Việt Nam. 

Không chỉ tham gia vào các buổi tham luận, anh Minh còn tranh tài với nhiều nhà khoa học, nghiên cứu trong cuộc thi về phân tích tâm lý (sentiment analysis) người tiêu dùng tại sự kiện IEEE-RIVF.

Không chỉ tham gia vào các buổi tham luận, anh Minh còn tranh tài với nhiều nhà khoa học, nghiên cứu trong cuộc thi về phân tích tâm lý (sentiment analysis) người tiêu dùng tại sự kiện IEEE-RIVF. Ảnh: FE.

Việc phân tích những bình luận của khách hàng về sản phẩm thuộc bài toán khai phá quan điểm, một trong những nhiệm vụ mấu chốt khi xử lý ngôn ngữ tự nhiên và có nhiều ứng dụng trong công nghiệp. 

Anh Minh đã phát triển một hệ thống phân lớp bằng kỹ thuật học máy (machine learning), trong đó kết hợp 3 mô hình phân lớp khác nhau. Học máy là một lĩnh vực của trí tuệ nhân tạo liên quan đến việc nghiên cứu và xây dựng các kỹ thuật cho phép hệ thống "học" tự động từ dữ liệu để giải quyết những vấn đề cụ thể. Tuy sản phẩm lọt Top 3 nhưng anh Minh cho rằng hệ thống của anh còn đơn giản và anh sẽ phải cải tiến thêm nữa để tăng độ chính xác. 

Đây không phải là dự án đầu tiên của anh Minh trong việc sử dụng trí tuệ nhân tạo và dữ liệu lớn giúp sức cho người Việt. Anh cùng đồng nghiệp tại Ban Công nghệ FPT đang xây dựng một nhóm nghiên cứu, học tập Deep Learning. Đây là công nghệ được cộng đồng học máy và xử lý ngôn ngữ tự nhiên rất quan tâm. Các ông lớn như Google, Microsoft cũng đang đầu tư "ác liệt" cho công nghệ này. Anh hài hước gọi nhóm của mình là "deep lunch" vì chuyên tận dụng cả giờ nghỉ trưa để bàn bạc, thảo luận.

"Tôi đang cố gắng cung cấp thêm nhiều học liệu, các bài thực hành để cả nhóm nắm bắt được những kiến thức cơ sở trong Deep Learning và cùng nhau vận dụng công nghệ này vào việc giải quyết một số bài toán thực tế". 

Vị tiến sĩ 32 tuổi ĐH FPT còn có kế hoạch nghiên cứu những phương pháp trích xuất thông tin hữu ích trong dữ liệu văn bản về y tế sức khoẻ. Dự án này sẽ giúp xác định nguyên nhân gây bệnh, ví dụ như viêm gan và hỗ trợ bác sĩ, người bệnh trong việc đưa ra quyết định. 

Ngoài ra, dự án về đoán nhận quan hệ suy diễn trong văn bản và hỏi đáp tự động cũng đang được anh ấp ủ dù anh nhận định đây là bài toán "cực kỳ khó và phải dồn mọi tâm huyết để đạt được".

Nói về mong muốn trong tương lai, anh Minh mong Viện Nghiên cứu công nghệ FPT sẽ có thêm các khóa sau đại học định hướng nghiên cứu và cấp học bổng cho các nghiên cứu sinh ưu tú để họ có thể chuyên tâm vào công việc này toàn thời gian. "Vì các khoa sau đại học chính là "trái tim" của một đại học nghiên cứu", anh Minh nói. 

IEEE-RIVF (Conference on Computing and Communication Technologies) là hội nghị quốc tế thường niên nhằm nâng cao sự thịnh vượng qua những đổi mới về công nghệ do Viện kỹ nghệ điện và điện tử Mỹ tổ chức. 

Viện Nghiên cứu công nghệ FPT (FTRI) thuộc ĐH FPT được thành lập năm 2010 do Tập đoàn FPT tài trợ 100% vốn tập trung vào bốn hướng nghiên cứu gồm: Ứng dụng công nghệ thông tin; Năng lượng sạch và Tiết kiệm năng lượng; Công nghệ sinh học; và Công nghệ vũ trụ. Năm 2012, vệ tinh F-1, do Phòng Nghiên cứu Không gian, Viện Nghiên cứu Công nghệ FPT, đã phóng thành công vào quỹ đạo.

Ngọc Dung - Trần Mai 

Ý kiến

()