Thành tích này đặc biệt ấn tượng khi Hugging Face hiện là nền tảng AI mã nguồn mở lớn nhất thế giới với hơn một triệu bộ dữ liệu và mô hình được chia sẻ bởi cộng đồng nghiên cứu, doanh nghiệp và nhà phát triển toàn cầu. Việc một bộ dữ liệu được xây dựng dành riêng cho thị trường Việt Nam xuất hiện trong nhóm dataset nổi bật nhất cho thấy nhu cầu ngày càng lớn đối với các nguồn dữ liệu AI bản địa chất lượng cao.
![]() |
Nemotron-Personas-Vietnam là bộ dữ liệu do FPT và NVIDIA phối hợp phát triển, bao gồm khoảng 900.000 hồ sơ nhân khẩu học tổng hợp, được xây dựng nhằm hỗ trợ cộng đồng AI phát triển các mô hình và ứng dụng phản ánh tốt hơn đặc điểm ngôn ngữ, văn hóa và bối cảnh xã hội của người Việt.
>> FPT hợp tác NVIDIA mở đường cho AI Native
Không chỉ ghi dấu bằng thứ hạng Top 10, bộ dữ liệu còn nhận được sự quan tâm từ cộng đồng nghiên cứu và phát triển AI quốc tế ngay trong những ngày đầu ra mắt. Đây được xem là tín hiệu tích cực cho thấy các nguồn lực AI “Make in Vietnam” hoàn toàn có khả năng tạo ra giá trị và sức ảnh hưởng trên quy mô toàn cầu.
![]() |
Thành tích này cũng tiếp tục khẳng định nỗ lực của FPT xây dựng hệ sinh thái AI mở, góp phần thúc đẩy các sáng kiến AI chủ quyền và mở rộng cơ hội tiếp cận các nguồn dữ liệu chất lượng cao cho cộng đồng công nghệ.
Top 10 toàn cầu sau 5 ngày phát hành không chỉ là một cột mốc đáng tự hào, mà còn là bước khởi đầu cho hành trình đưa các nguồn lực AI do người Việt phát triển đến gần hơn với cộng đồng AI trên toàn thế giới.
| Người dùng có thể tìm hiểu thêm về Nemotron-Personas-Vietnam tại: https://short.factory.fpt.ai/DDfg3 Bộ dữ liệu hiện được phát hành công khai trên Hugging Face và có thể tải xuống tại: https://short.factory.fpt.ai/BguFv |
Anh Đức


Ý kiến
()