Chúng ta

BOT nhập liệu số 'thách thức' giới công nghệ với độ chính xác vượt trội

Thứ ba, 5/10/2021 | 10:02 GMT+7

Tham gia vòng chung khảo iKhiến số 7, đại diện FPT Software với giải pháp BOT nhập liệu số đã gây ấn tượng mạnh khi công bố độ chính xác lên tới 99,3% - điều mà các công cụ tương tự khác trên thị trường hiện nay khó thể làm được.

Sáng tạo để 'refresh' bản thân

Năm này qua năm khác, những dự án về data entry (nhập liệu) khiến chị Nguyễn Thị Hồng Nhung (DPS.VN.EDP) thuộc nằm lòng các đầu việc. Với một quản trị dự án (PM) lâu năm như chị, công việc ngày nào cũng chừng đó quy trình, không có quá nhiều sự thay đổi.

Để không bị “ngủ quên” trên chiến thắng, chị bắt đầu đi tìm lời giải cho bài toán cải tiến quy trình - một việc rất đỗi quen thuộc tại FPT Software, nhưng không phải ai cũng nghĩ cách thay đổi. Chị Nhung đã tìm đến bộ phận DPS Tool - đội ngũ chuyên hỗ trợ giải pháp cho tất cả dự án tại đơn vị, đề nghị hợp tác, tìm hướng đi mới cho dự án về data.

A-nh-ghe-p-Ho-c-vie-n-Nghe-thu-3278-9984

Nhóm dự án BOT Nhập liệu số - đại diện FPT Software tham gia vòng Chung khảo iKhiến số 7 năm 2021. 

Anh Đỗ Xuân Tiến - “ông trùm” sáng tạo của DPS Tool, đã rất chăm chú nghe chị Nhung giới thiệu về những dự án mà chị đang quản trị. Anh không đáp vội mà trầm ngâm một hồi lâu. Anh gợi mở, mấu chốt của một giải pháp chính là giải quyết quy trình cụ thể, nên việc tìm ra điểm chung là điều rất quan trọng. Ý của Đỗ Xuân Tiến được chị Nhung ngầm hiểu là cần tìm ra những điểm giống nhau của các dự án data. Còn anh Tiến lại nghĩ thêm một chút. Anh đang "mở cờ trong bụng" vì điểm chung sâu xa hơn nữa đó là sự trùng khớp đến lạ kì giữa dự án của chị và một sản phẩm đang còn dở dang do chính anh xây dựng. 

Trở về từ cuộc gặp với Tiến, những ngày sau đó, tham vọng tạo một giải pháp công nghệ mới đã giúp chị Nhung có thêm nhiều động lực. Tinh thần sáng tạo khiến mỗi ngày của chị không còn là một vòng lặp nhàm chán. Trong đầu chị bắt đầu lộ dần những ý tưởng. Lâu lắm rồi, chị không còn mày mò và nghĩ nhiều đến những điều mới. Nhưng máu công nghệ vẫn ăn sâu vào con người của chị.

Với kinh nghiệm dày dạn qua nhiều dự án, chị đi đến quyết định sẽ cải tiến quy trình với tham vọng tạo ra một nhân viên nhập liệu ảo. “Lúc đó tôi chỉ đinh ninh một điều rằng, nếu muốn thay đổi và phát triển thì chỉ có con đường tự động hoá. Dù chưa biết bản thân có làm được gì hay không, nhưng tôi thấy mình có nguồn năng lượng mới khi say sưa với dự án, với nghiên cứu và sáng tạo”, chị Nhung nói. 

BOT nhập liệu số ra đời

Bằng 2 từ khóa là “con số” và “tự động”, giấc mơ sáng tạo của chị Nhung và cơ duyên gặp Đỗ Xuân Tiến dần được hiện thực hóa với ý tưởng xây dựng một Entry BOT – BOT nhập liệu số.

Hiểu biết rất nhiều công nghệ mới, anh Đỗ Xuân Tiến đề xuất áp dụng nền tảng Nhận dạng ký tự quang học (OCR - Optical Character Recognition) vì có rất nhiều điểm chung, phù hợp với dự án nhập liệu. Đây là công cụ được tạo ra để chuyển các hình ảnh có chứa chữ viết/kí tự (được quét bằng máy scanner) thành các đoạn text hoặc văn bản hoàn chỉnh.

Để tạo ra một Entry BOT, toàn đội còn dùng đến công nghệ RPA để tự động hóa thu thập dữ liệu. Nói về quyết định này, anh Tiến lí giải, RPA (Robotic Process Automation) hiểu đơn giản là tự động hóa quy trình bằng robot. Đây là công nghệ rất căn bản, được tạo ra để bắt chước hành động của con người, thực hiện các tác vụ lặp đi lặp lại. Với "kim chỉ nam" đó, toàn đội gấp rút triển khai công cụ có thể tự động đọc hình ảnh, đưa lên hệ thống xử lý và hiển thị kết quả cho người nhập.

A-nh-chu-p-Ma-n-hi-nh-2021-10-3545-9087-

Anh Đỗ Xuân Tiến, người có rất nhiều sáng kiến về giải pháp công nghệ tại FPT Software. 

Tuy nhiên, công cụ sẽ không thay thế được một nhân viên điều hành nếu chỉ dừng lại ở việc áp dụng các giải pháp trên. Để hoàn thiện hơn nữa, toàn đội đã đưa công nghệ trí tuệ nhân tạo (AI) vào cuộc.

Khó khăn nhất chính là thời gian xử lí data. Việc “training” cho AI hiểu được số viết tay tiếng Nhật với yêu cầu chính xác tuyệt đối khiến toàn đội phải căng sức. Nhiều hôm, chị Nhung và các cộng sự phải làm thêm giờ, tranh thủ cả giờ nghỉ trưa để kịp gửi dữ liệu cho phía kỹ thuật.

Đáp lại những vất vả đó, tín hiệu khả quan khi áp dụng AI khiến mọi người tin tưởng rất nhiều vào sản phẩm lần này. AI đã giúp kết nối chặt chẽ các bước, đưa kết quả chính xác lên màn hình. Các công đoạn xử lí đã được tự động hoá. Thay vì phải ngồi nhập thủ công, giờ đây người dùng chỉ cần tham gia vào bước phê duyệt kết quả. Trước đây, những ngày khối lượng công việc tăng đột biết, chị Nhung phải rất vất vả điều động nhân sự, xắn tay cùng làm với cả team đến tận đêm. Nhưng với công cụ mới này, các tác vụ đều được xử lí kết quả trong vài giây. 

Vượt trội về độ chính xác 

Sau hàng chục nghìn thử nghiệm và 1 năm áp dụng trực tiếp vào dự án, BOT Nhập liệu số đã cho kết quả thống kê về độ chính xác của sản phẩm lên tới 99,3% - tương đương với độ chính xác của một nhân viên và vượt trội hơn hẳn so với công cụ tương tự hiện có trên thị trường.

Lí giải về kết quả này, anh Tiến khẳng định, việc nhận diện 1 tệp data và thực hiện quét quang học để đạt được độ chính xác cao là điều không thể. Thậm chí, ngay cả những nhà cung cấp lớn trên thị trường hiện nay cũng không đạt được độ chính xác cao. Chưa nói đến việc đây là các loại ký tự, chữ số viết bằng tay thì khó hơn rất nhiều. Nhìn từ dự án, data lại được scan nên có khi bị nghiêng, thậm chí bị mờ... Chính vì vậy, khi tiếp cận bài toán, cả đội đã quyết định cần phải "chia để trị" mới có thể tạo nên sự thay đổi. 

Vì thế, dữ liệu đầu vào đều được ưu tiên tập trung xử lý hình ảnh sao cho đạt được độ sáng và xoay ảnh phù hợp. Tiếp theo sẽ đưa vào tool cắt nhỏ (mịn) dữ liệu ra thành nhiều mảnh: các mảnh chữ viết số, chữ viết tay, địa chỉ email, số điện thoại… sau đó mới dùng đến công nghệ Nhận diện quang học để thực hiện xử lí và ghép lại thành tệp ban đầu. Nhờ quy trình xử lí bước 1 rất tốt này, BOT Nhập liệu số đã có những khác biệt rõ rệt so với các sản phẩm cùng loại.

Cũng theo anh Tiến, sản phẩm đang chạy trong dự án thực tế và được sử dụng để thay thế cho 1 nhân viên nhập liệu, nên độ chính xác có thể so sánh như con người. Điều này còn giúp BOT nhập liệu ngày càng thông minh, khi sản phẩm dùng chính data cũ đã nhập của dự án để training cho AI. Chưa kể, nhân viên nhập liệu dự án vừa tham gia xử lí công việc, vừa là cách để đào tạo, nâng cấp vận hành của sản phẩm. Việc này được lặp lại liên tục, khiến công cụ ngày một tốt hơn. 

Kể từ khi áp dụng (tháng 11/2019) đến nay, Entry BOT đã tiết kiệm cho dự án nguồn kinh phí khoảng 285 triệu đồng. Ngoài ra, những PM dự án như chị Nhung có thể tính toán được khối lượng công việc, chủ động điều phối nhân sự, tận dụng được nguồn lực. Trung bình, dự án sẽ giảm được 5% chi phí nhân sự khi có Entry BOT. Hiện nay, nhiều dự án tại FPT DPS đều liên quan khá nhiều đến nhập liệu. Nếu áp dụng Entry BOT cho toàn đơn vị, có thể tiết kiệm lên đến khoảng 12,5 tỷ đồng/năm.

Ngoài ra, điều khiến chị Nhung tin tưởng và hài lòng nhất chính là độ chính xác của công cụ tương đương với một nhân sự. Thậm chí, tỷ lệ rủi ro sai sót ngoài ý muốn được giảm xuống tối thiểu.

Trong tương lai, chị đang đặt tham vọng biến Entry BOT thành một sản phẩm dịch vụ có thể mở bán ra thị trường. Chị cũng nhìn thấy được sự tương đồng của dự án so với các hoạt động tại FPT. “Khi các đơn vị như FPT Retail, FPT Telecom… cần nhập dữ liệu và vẫn dùng mẫu giấy, thì Entry BOT là giải pháp hiệu quả để tự động hóa mọi thứ. Chúng tôi tin tưởng vào độ chính xác của sản phẩm, nếu không muốn nói là chính xác tuyệt đối”, chị cho hay.

Góp mặt tại chung khảo số 7 - Sáng tạo FPT (iKhiến), nhóm dự án "BOT nhập liệu số" từ FPT Software đã gây ấn tượng mạnh với hội đồng giám khảo khi tự tin công bố độ chính xác của sản phẩm là hơn 99,3%. Đại diện BGK cho rằng, đây là một con số ấn tượng vì một công cụ tương tự nhận diện chữ tiếng Việt có độ chính xác khoảng 80% đã là cao. Nhóm tác giả cho biết độ chính xác đã được đo lường trong quá trình nhân sự kiểm tra lại dữ liệu nhập (bắt buộc) và khách hàng kiểm tra ngẫu nhiên, được tính trên 55.000 tài liệu đã thực hiện (dữ liệu vận hành).

>>iKhiến số 7: Sáng tạo 'vượt khó thời dịch' tranh tài

Nguyễn Huy

Ý kiến

()