![]() |
| Nemotron-Personas-Vietnam. |
Nemotron-Personas-Vietnam là một phần mở rộng của hệ sinh thái NVIDIA Nemotron, bao gồm các mô hình, bộ dữ liệu, tài nguyên đánh giá và thư viện NVIDIA NeMo. Thông qua hệ sinh thái này, các nhà phát triển có thể tùy chỉnh, đánh giá và triển khai các hệ thống AI cho những nhu cầu sử dụng tại Việt Nam và từng thị trường địa phương.
Bộ dữ liệu được cung cấp miễn phí cho cả mục đích thương mại và phi thương mại, nhằm hỗ trợ cộng đồng phát triển các hệ thống AI hiểu rõ hơn về ngôn ngữ, văn hóa và bối cảnh sống của người Việt.
Phát triển ứng dụng AI với năng lực am hiểu bản địa
Theo hai bên, mỗi “persona” là một hồ sơ giả lập đại diện cho một nhóm người trong xã hội, bao gồm thông tin về độ tuổi, nghề nghiệp, khu vực sinh sống và các yếu tố bối cảnh. Đây không phải là dữ liệu của một cá nhân thật cụ thể, mà là bản ghi tổng hợp giúp mô tả các nhóm người dùng khác nhau trong đời sống thực. Khi được tổng hợp ở quy mô lớn, tập dữ liệu này tạo thành một “bức tranh số” phản ánh cách người Việt học tập, làm việc và giao tiếp, qua đó giúp các mô hình AI có thể xử lý tình huống sát thực tế hơn.
Trong bối cảnh nhiều hệ thống AI hiện nay được huấn luyện chủ yếu trên dữ liệu toàn cầu, việc thiếu hụt dữ liệu bản địa khiến các ứng dụng khi triển khai tại Việt Nam đôi khi chưa phù hợp về ngữ cảnh hoặc cách diễn đạt. Nemotron-Personas-Vietnam được kỳ vọng sẽ thu hẹp khoảng cách này, giúp AI không chỉ “nói tiếng Việt” mà còn “hiểu người Việt”, từ đó cải thiện hiệu quả trong các bài toán ứng dụng tại Việt Nam.
Sự hợp tác giữa FPT và NVIDIA kết hợp giữa nền tảng công nghệ và năng lực bản địa hóa. NVIDIA đóng góp khung mô hình mở, thư viện dữ liệu tổng hợp NeMo Data Designer và phương pháp Nemotron-Personas. Trong khi đó, FPT đảm nhiệm việc xây dựng, xác thực và triển khai dữ liệu dựa trên thực tiễn tại Việt Nam, đồng thời cung cấp hạ tầng tính toán phục vụ quá trình phát triển.
![]() |
| Hạ tầng AI mới của FPT sử dụng CPU NVIDIA. |
Với vai trò là NVIDIA Preferred Partner, FPT đóng góp chuyên môn địa phương, phương pháp xác thực, hạ tầng dữ liệu và năng lực nghiên cứu AI thông qua FPT Smart Cloud, Viện Quantum AI & Cyber Security và FPT DC5. Trong đó, FPT Smart Cloud cung cấp dịch vụ GPU Cloud và nền tảng suy luận AI; Viện Quantum AI & Cyber Security tham gia xây dựng phương pháp kỹ thuật và xác thực tập dữ liệu; FPT DC5 vận hành khảo sát thực địa và hỗ trợ quy trình thu thập dữ liệu.
Đáng chú ý, bộ dữ liệu được phát hành theo hướng mở và tương thích với các công cụ phổ biến trong hệ sinh thái AI, cho phép các nhà phát triển dễ dàng truy cập, tùy chỉnh và ứng dụng vào sản phẩm của mình. Cụ thể, mỗi bản ghi trong Nemotron-Personas-Vietnam chứa 31 trường dữ liệu, gồm 9 trường persona, 6 trường thuộc tính persona, 15 trường ngữ cảnh và 1 mã định danh duy nhất, giúp nhà phát triển lọc, phân loại và nhắm mục tiêu đến các nhóm dân số cụ thể. Tập dữ liệu được phát hành mã nguồn mở trên Hugging Face và tương thích với các thư viện NVIDIA NeMo trong toàn bộ vòng đời phát triển AI, từ chuẩn bị dữ liệu, tinh chỉnh, hậu huấn luyện đến triển khai.
Đây được xem là một bước đi nhằm thúc đẩy “AI chủ quyền”, tức các hệ thống AI được xây dựng dựa trên dữ liệu, ngôn ngữ và quy định của từng quốc gia, thay vì phụ thuộc hoàn toàn vào các mô hình chung toàn cầu.
Đại diện FPT cho biết, AI chủ quyền phải được xây dựng từ nền tảng để phản ánh ngôn ngữ, văn hóa và thực tiễn kinh tế địa phương. Tập dữ liệu Nemotron-Personas-Vietnam thể hiện cam kết của chúng tôi trong việc giúp các nhà phát triển AI dễ dàng tiếp cận các nguồn lực cần thiết để xây dựng các giải pháp AI dành cho Việt Nam và có thể mở rộng ra khu vực .
Thúc đẩy AI có chủ quyền cho Việt Nam trên quy mô lớn
AI có chủ quyền ngày càng quan trọng với các quốc gia và ngành công nghiệp nơi các mô hình chung không đủ để đáp ứng các bài toán đặc thù của từng khu vực địa lý, ngành nghề. Các quốc gia cần AI có thể hiểu ngôn ngữ, thích ứng với khuôn khổ pháp lý và phù hợp với bối cảnh địa phương. Việc xây dựng và triển khai AI có chủ quyền đòi hỏi một hạ tầng AI mạnh mẽ phục vụ khối lượng công việc tính toán hiệu năng cao và suy luận ở quy mô lớn.
Với tầm nhìn làm chủ công nghệ AI, FPT liên tục mở rộng hệ sinh thái công nghệ, cho phép các nhà đổi mới AI để huấn luyện và triển khai AI trong phạm vi khu vực thông qua ba lớp tích hợp:
Dịch vụ GPU Cloud: Cung cấp nền tảng tính toán hiệu năng cao, sử dụng các dòng GPU mới nhất từ NVIDIA để huấn luyện và chạy các mô hình AI.
Nền tảng AI sẵn sàng suy luận: Cung cấp các công cụ cần thiết để triển khai các mô hình AI tiên tiến ở quy mô lớn.
Ứng dụng AI sẵn dùng: Đưa các khả năng AI chủ quyền trực tiếp đến các doanh nghiệp và tổ chức Việt Nam
Ba lớp năng lực này hợp thành một hệ sinh thái AI chủ quyền hoàn chỉnh, phục vụ toàn bộ chuỗi giá trị AI từ dữ liệu nền tảng và các mô hình mở đến các sản phẩm AI đã được triển khai và bản địa hóa, được xây dựng cho Việt Nam và có thể nhân rộng ra các quốc gia trong khu vực.


Ý kiến
()