News Monitoring là kết quả miệt mài trong suốt 6 tháng của nhóm các thành viên STU mà Trần Quang Ân là người đóng vai trò lập trình viên chính, trực tiếp phát triển phần core học máy, web service, module thu thập tin bài trên các báo điện tử tiếng Anh cho chương trình, phục vụ demo POC.
Với nhiệm vụ này, anh Ân không chỉ tham gia khảo sát, ứng dụng các công cụ học máy và các thư viện hay được dùng trong lĩnh vực xử lý ngôn ngữ tự nhiên (NLP - Nature Language Processing) mà còn tiến hành thực nghiệm các phương pháp vector hóa văn bản (tin bài) và các mô hình phân loại hay được dùng trong các bài toán phân loại văn bản để tìm ra giải pháp học máy tốt nhất cho chương trình.
Mục tiêu của Trần Quang Ân là học thêm nhiều kỹ thuật trong lĩnh vực NLP, Data mining, Big data và Deep learning để có thể trở thành Senior researcher và thực hiện ước mơ làm ra những sản phẩm công nghệ có tính ứng dụng cao, vươn ra ngoài biên giới lãnh thổ. Ảnh: NVCC. |
Là sản phẩm tự động đầu tiên trong mảng giám sát tin tức có áp dụng trí tuệ nhân tạo và học máy (machine learning), News Monitoring đảm bảo việc thu thập tin tức được ổn định và đầy đủ với độ phân loại chính xác cao lên tới hơn 90%.
Cơ chế hoạt động của ứng dụng này khá đơn giản. Đầu tiên, chương trình liên tục tự động thu thập tin tức liên quan tới các công ty lớn trên thế giới (Pepsi, Barclays, ANZ, AIG, Zurich...) từ các nguồn báo điện tử tiếng anh (BBC, CNN…). Tiếp theo, chương trình sẽ tự động phân loại tin bài đó theo các tiêu chí về kinh doanh để trợ giúp người dùng thống kê cũng như nhận định chính xác về tình hình hoạt động của các công ty "trong tầm ngắm".
Ân cho biết, yêu cầu của khách hàng khá phức tạp, đòi hỏi phải thu thập nhiều nguồn tin bài liên quan đến nhiều doanh nghiệp lớn trên thế giới. Số lượng phân nhóm mà khách hàng muốn phân loại tin bài khá nhiều với hơn 10 phân nhóm, lại đều những phân nhóm này thiên về nghiệp vụ doanh nghiệp và dễ gây nhầm lẫn thậm chí với cả việc đọc bằng con người. Do đó, nếu chỉ dùng những phương pháp thông thường thì kết quả độ chính xác của chương trình thu được rất thấp.
Trước những khó khăn đó, Ân và các đồng nghiệp đã dành nhiều nỗ lực và thời gian để nghĩ và thử làm đi làm lại nhiều phương pháp khác nhau. Một phần may mắn nhờ có sự chỉ dẫn từ tiến sĩ Ngô Xuân Bách, cùng đến từ STU, người có nhiều kiến thức và kinh nghiệm trong lĩnh vực xử lý ngôn ngữ tự nhiên nên cuối cùng, sản phẩm đã được nghiệm thu và nhận đơn đặt hàng từ khách.
Đối với News Monitoring, nhóm của Ân đã áp dụng những tài nguyên trong xử lý ngôn ngữ tự nhiên, các thư viện học máy trong phân loại xử lý văn bản... vốn là những công nghệ mà anh từng được tiếp cận từ ngay sau khi vào FPT Software hồi 2013 và cũng là chuyên môn chính của lập trình viên mảng xử lý ngôn ngữ tự nhiên, Data mining và Big Data như anh.
Để nắm bắt những diễn biến mới của lĩnh vực, Ân chăm chỉ học hỏi từ các "đàn anh" trong STU.lab, các diễn đàn, tạp chí công nghệ. Đồng thời, chàng trai trẻ cũng phải tranh thủ thực hành code các chương trình ứng dụng và chia sẻ kinh nghiệm với đồng nghiệp.
Ngoài News Monitoring, Ân cũng đã tham gia viết nhiều sản phẩm như SayToDo tiếng Việt, Nhật; FPT Play Recommender System; SmartRouter... Tuy nhiên, mục tiêu xa hơn của anh là học thêm nhiều kỹ thuật trong lĩnh vực NLP, Data mining, Big data và Deep learning để có thể trở thành Senior researcher và thực hiện ước mơ làm ra những sản phẩm công nghệ có tính ứng dụng cao, vươn ra ngoài biên giới lãnh thổ.
Bộ lọc thông tin tự động và đánh giá rủi ro (New Monitoring) là một trong 19 đề cử FPT Tech Awards 2016 và Trần Quang Ân là một trong 7 ứng viên hạng mục Gương mặt tiêu biểu. FPT Tech Awards là giải thưởng thường niên nhằm tôn vinh các sản phẩm công nghệ mang thương hiệu FPT do trang tin Chungta.vn, Ban Truyền thông và Ban Công nghệ FPT phối hợp tổ chức từ năm 2015.
Năm nay, có 19 sản phẩm/dịch vụ và cá nhân được các đơn vị đề cử FPT Tech Awards. Hạng mục Khách hàng đại chúng có 3 sản phẩm của FPT Telecom gồm: FPT HI GIO Cloud, FPT Play Box, Hi FPT (FPT Telecom). Ba sản phẩm/dịch vụ của FPT IS tham gia ở nội dung Khách hàng Chính phủ - Doanh nghiệp gồm: Nền tảng tích hợp dữ liệu; Giải pháp iBus - hệ thống quản lý và điều hành vận tải xe buýt thông minh; và Ứng dụng nộp thuế trực tuyến. Cùng hạng mục này, FPT Software góp 2 sản phẩm/dịch vụ: Bộ chuyển đổi Cobol sang Java; Bộ lọc thông tin tự động và đánh giá rủi ro. Hạng mục Ứng dụng CNTT trong quản trị có 5 sản phẩm/dịch vụ của các đơn vị: FPT Retail với Hệ thống quản lý chuỗi bán lẻ; FPT Software với Self service portal; FPT Online với Quản trị nội bộ; và FPT Trading với hai sản phẩm/dịch vụ là Hệ thống quản lý sửa chữa FSM cho FPT Services và Hệ thống quản lý bán hàng FTG Salesman. Riêng hạng mục Gương mặt tiêu biểu gắn với sản phẩm/dịch vụ ứng cử có 6 ứng viên. Phạm Minh Tuấn (Giám đốc Trung tâm Công nghệ mới - FPT IS GMC) và Hà Công Bằng (Senior Solution Developer) đến từ FPT IS. FPT Software có sự góp mặt của Trần Quang Ân, Trần Hồng Nam (Ban Công nghệ FPT Software). FPT Online đề cử Nguyễn Văn Tình (Phó Giám đốc Trung tâm Kỹ thuật). FPT Trading có đại diện Đào Ngọc Anh (Trưởng phòng Phần mềm, Ban Công nghệ FPT Trading). Thời gian bình chọn online trên Chungta.vn được dự kiến bắt đầu từ ngày 29/5 đến 1/6. Kết quả sẽ được công bố vào ngày 2/6 và trao giải tại sự kiện thường niên Tech Day FPT 2017 (diễn ra ngày 6/6). |
Tiểu Thanh
Ý kiến
()