Nhóm chuyên gia gồm 5 nhà nghiên cứu đến từ FPT Software (Công ty thành viên của Tập đoàn FPT) nhận bằng sáng chế cho giải pháp công nghệ “Group-equivariant convolutional neural networks for 3D point clouds” - Mạng nơ-ron tích chập đẳng biến với các phép biến đổi nhóm để xử lý Đám mây điểm 3D. Công nghệ này ứng dụng trong huấn luyện trí tuệ nhân tạo (AI) nhận dạng hình ảnh qua học sâu (deep learning).
Nhờ tính ứng dụng và hiệu quả cải thiện đáng kể, nhóm chuyên gia đã được trao một trong những bằng sáng chế uy tín nhất thế giới bởi Văn phòng Sáng chế và Nhãn hiệu Hoa Kỳ (USPTO). Hoạt động từ năm 1836, USPTO đã cấp bằng chế đầu tiên của nước Mỹ được Tổng thống George Washington ký chứng nhận.
Sáng chế này giúp cải thiện độ chính xác trong huấn luyện AI nhận diện vật thể từ 1 góc chụp hình nhờ cơ chế tăng cường hiệu suất tính toán cho mạng nơ-ron phân tách đặc trưng của vật thể. Mạng nơ-ron dễ dàng được thiết lập và triển khai cho nhiều bên, tạo ra giải pháp công nghệ có tính ứng dụng cao. Đồng thời, với cách huấn luyện AI này, lượng dữ liệu đầu vào cần ít hơn so với các cách làm trước đó, tiết kiệm nguồn lực đáng kể.
Bằng sáng chế do USPTO cấp cho nhóm nhà nghiên cứu FPT Software |
Nhóm các nhà nghiên cứu đến từ nhiều bộ phận của FPT Software như bộ phận tư vấn chuyển đổi số toàn cầu, phòng nghiên cứu AI và cả các nghiên cứu sinh được đào tạo từ chương trình AI Residency. Đặt mục tiêu chung là nghiên cứu giải pháp ứng dụng công nghệ đám mây điểm 3D vào thực tiễn, các nhà khoa học phát hiện ra những điểm hạn chế khi kết hợp AI với đám mây điểm 3D.
Đám mây điểm 3D là tập hợp các điểm trong không gian ba chiều thể hiện một hình ảnh thu nhỏ các vật thể - ứng dụng trong tái tạo hình ảnh và vật thể 3D. Theo đại diện nhóm, với sự phát triển của các dòng máy ảnh 3D hiện đại, các kho ảnh 3D dạng đám mây điểm ngày càng nhiều lên.
Tuy nhiên, trong quá trình ứng dụng đám mây điểm 3D vào deep learning để hỗ trợ huấn luyện AI, đến năm 2020 các nhà khoa học thế giới vẫn nhận định dù deep learning đã giải quyết được nhiều vấn đề trên ảnh 2D nhưng việc áp dụng lên đám mây điểm 3D vẫn chỉ ở mức bắt đầu. Đặc biệt nếu dữ liệu đám mây điểm 3D chỉ có trên một góc chụp, khả năng AI nhận diện vật thể qua các góc chụp khác còn cần cải thiện.
Đặt mục tiêu cải thiện việc huấn luyện AI, nhóm nghiên cứu kết hợp mô hình deep learning tiên tiến là mạng nơ-ron tích chập, có thể phân tách hình ảnh đầu vào để đưa ra các đặc trưng riêng của vật thể. Được ứng dụng trong nhận dạng hình ảnh, mạng nơ-ron được sử dụng rộng rãi trong đa ngành từ công cụ tìm kiếm, bảo mật đến y khoa. Nhóm nghiên cứu cũng tìm tòi, thử nghiệm cách đơn giản hóa việc thiết lập và vận hành mạng nơ-ron để mang ứng dụng lại gần hơn với đời sống.
Qua gần một năm nghiên cứu, các chuyên gia FPT Software đã thử nghiệm thành công cách thức mới khi kết hợp mạng nơ-ron có tính chất đẳng biến và phép quay (rotation - equivariant). Cốt lõi của phát kiến này là hệ thống cơ sở hạ tầng chứa các câu lệnh có sẵn, khi được nạp dữ kiện Đám mây điểm 3D sẽ triển khai mạng nơ-ron đã được thiết lập sẵn, cho đầu ra là một tenxơ (tensor) có toàn bộ thông tin của vật thể trong không gian ba chiều.
Nhóm nghiên cứu bao gồm thành viên là các nghiên cứu sinh được đào tạo từ chương trình AI Residency (ảnh minh họa) |
Chia sẻ về dấu mốc quan trọng này, anh Nguyễn Xuân Phong - Giám đốc AI của FPT Software và cũng là một trong năm nhà nghiên cứu, cho biết: “Thành công này khẳng định chất lượng nghiên cứu và tính sáng tạo của các giải pháp độc quyền do FPT Software xây dựng. Nhờ sự đầu tư kiên trì vào nghiên cứu, chúng tôi có thêm cơ sở để đưa sản phẩm và khẳng định uy tín trên đấu trường quốc tế. Bên cạnh đó, nghiên cứu chất lượng này là nền móng để FPT Software phát triển các giải pháp thông minh trong thời gian tới.”
Theo số liệu của USPTO, đến năm 2019 văn phòng đã cấp hơn 4.000 bằng sáng chế công nghệ mảng AI/học máy, trên 60.000 hồ sơ gửi tới mỗi năm. Trong số các bằng sáng chế AI được cấp trên toàn thế giới, đến 40% bằng nằm trong mảng học máy theo thống kê của Wipo. Trong đó, deep learning và mạng nơ-ron là các mảng được các “ông lớn” công nghệ nghiên cứu, phát triển nhiều nhất.
Là một trong những doanh nghiệp công nghệ hàng đầu Đông Nam Á, FPT Software đang đầu tư mạnh mẽ vào phát triển nhân tài và nghiên cứu AI. Dự kiến, FPT Software sẽ mở rộng cả nghiên cứu và ứng dụng cho các dự án liên quan đến nhận diện hình ảnh và deep learning, sử dụng dữ liệu 3D dạng đám mây điểm. Bên cạnh đó, chương trình đào tạo AI Residency là một trong những cơ hội cho các nhà nghiên cứu trẻ gặp gỡ, học hỏi từ các chuyên gia AI hàng đầu, hòa mình cùng cộng đồng AI đẳng cấp thế giới.
Anh Vân
Ý kiến
()