Chúng ta

VnExpress sáng tạo giải pháp chống vi phạm bản quyền

Thứ bảy, 26/12/2020 | 09:00 GMT+7

Hệ thống Copyright Detection System tự động nhận diện các trường hợp sử dụng trái phép nội dung báo (text, hình ảnh) VnExpress trên hơn 150 trang thông tin điện tử trong nước.

Theo nhóm tác giả Lưu Xuân Việt - Nguyễn Thị Thu Hoà (FPT Online), công cụ sẽ tự động phát hiện, phân tích mức độ vi phạm, thống kê và gửi báo cáo về cho người quản lý. Khi nhìn vào trang, người quản lý sẽ thống kê được bao nhiêu trường hợp vi phạm trong ngày, đến từ những trang nào, mức độ vi phạm, chuyên mục bị vi phạm nhiều nhất.

VnE-JPG-4236-1609241774.jpg

Các bài báo bị vi phạm bản quyền sẽ được hệ thống tự động phát hiện.

Hiện tại, giải trí và hậu trường ngôi sao là những chuyên mục thường xuyên bị vi phạm nhất trên báo điện tử VnExpress và các chuyên trang iOne, ngoisao.net. Người quản lý có thể xem cụ thể thông tin hay hình ảnh nào bị lấy và có thể xuất thẳng ra một báo cáo để giao cho ban pháp chế xử lý. Hệ thống cũng linh hoạt khi phân chia thành dạng: lấy 100%, chỉ hình ảnh, toàn bộ hoặc một phần thông tin,…

Về mức độ phát hiện vi phạm còn tùy thuộc vào tầm ảnh hưởng của sự kiện, thời gian diễn ra sự kiện đó. Chúng ta xem lại lịch sử quét, có những ngày lên đến 400 tình trạng vi phạm nhưng có ngày chỉ khoảng 200 vi phạm. Ví dụ: ngày 27/11, tình trạng vi phạm lên cao khi có sự kiện danh thủ huyền thoại Diego Maradona qua đời với 157 trường hợp vi phạm chỉ trong một buổi sáng. Trước đây, tình trạng kiểm soát bản quyền bị thả lỏng do hành lang pháp lý và định hướng kinh doanh. Nhưng trong hai năm gần đây, khi tình trạng vi phạm càng ngày càng tăng cao và nguồn lợi từ việc “xuất khẩu” thông tin, yêu cầu về việc phát hiện vi phạm mới bắt đầu được đưa ra.

39058011-10212772785617884-327-9863-4699

Anh Lưu Xuân Việt tin rằng hệ thống không chỉ giúp hạn chế vi phạm bản quyền mà còn mang về nguồn thu cho FPT Online.

Trước khi có công cụ này, việc phát hiện vi phạm mất rất nhiều thời gian. Người quản lý phải search Google, sau đó vào đọc chi tiết từng bài và so sánh, phân tích mức độ sao chép đã đủ để xác định vi phạm, tra cứu trang vi phạm thuộc nhóm nào trong những nhóm quản lý (đối thủ hay đối tác của VnExpress). Trung bình VnExpress và những trang báo cùng hệ sinh thái xuất bản hơn 500 tin bài/ngày. Để đọc và tra cứu một bài viết cần ít nhất từ 30 - 60 phút. Vì vậy, việc quét toàn bộ lượng tin bài khổng lồ trên cần từ 300-500 giờ làm việc liên tục, trong khi đội ngũ phụ trách việc này chỉ có 4 người. Công việc đó gần như không thể.

Sau một năm hoạt động, công việc bắt đầu bộc lộ nhiều lỗ hổng và quá tải. Vì chỉ lượng ít ỏi khoảng 20 tin/bài trên trang chủ được kiểm tra, trong khi những bài còn lại trong các chuyên mục đều không kiểm soát nổi. Việc sử dụng lực lượng cộng tác viên cũng không thể chủ động. Vì vậy, cần thiết phải có hệ thống tự động quét, phát hiện, phân tích sàng lọc, lưu trữ và báo cáo các trường hợp vi phạm gần như ngay lập tức.

Sau thời gian thử nghiệm, hệ thống sẽ trở thành cơ sở hình thành cơ chế bảo vệ bản quyền của các tờ báo. Hiện tại, trên thị trường Việt Nam vẫn chưa có trang báo nào cung cấp dịch vụ tra cứu bảo vệ bản quyền như VnExpress. Và đây có thể trở thành dịch vụ để cung cấp cho các bên đối tác khác.

Sau khoảng 1 tháng thí điểm, từ tháng 7/2020, công cụ kiểm tra chính thức đưa vào sử dụng. Công nghệ so sánh hình ảnh và text tuy không mới nhưng lại rất phù hợp với yêu cầu của VnExpress và định hướng chuyển đổi số ở FPT. Việc áp dụng công cụ tự động hóa đã giúp tối ưu thời gian làm việc lên đến 90%, từ khoảng 60 phút/tin bài để phát hiện và báo cáo vi phạm, giờ chỉ còn trong một vài cú click chuột.

IMG-3496-JPG-9995-1609241774.jpg

Chị Nguyễn Thị Thu Hòa nhận giải Bạc của vòng chung kết iKhiến số 4.

FPT Online nói chung và VnExpress nói riêng đang định hướng đến việc kinh doanh nội dung về hình ảnh, video và text. Vì vậy, công cụ kiểm tra ra đời là điều vô cùng cần thiết và đúng thời điểm để áp dụng cơ chế bản quyền. Việc áp dụng công cụ cũng mở ra nhiều cơ hội kinh doanh, như: gia tăng hợp tác chia sẻ thông tin với nhiều đối tác, nâng cao giá trị thỏa thuận và giới thiệu công cụ với những khách hàng có nhu cầu.

Theo thống kê dựa trên 155 trang mà công cụ đang theo dõi, nếu thu 20 triệu đồng/đối tác/tháng, doanh thu một năm có thể lên đến hơn 2 tỷ đồng. Ngoài ra, còn có thể kinh doanh nguồn tài nguyên hình ảnh đang còn lãng phí. Trong thời gian tới, ngoài việc phát hiện vi phạm hình ảnh và text, công cụ sẽ được nâng cấp để phát hiện vi phạm về video và audio.

vòng chung kết iKhiến số 4, giải pháp của FPT Online đã nhận được giải Bạc chung cuộc. “Chúng tôi vẫn chưa giành được giải Vàng của cuộc thi nên giải Bạc sẽ là động lực để mọi người tiếp tục tìm tòi, đưa ra nhiều giải pháp khác trong những đợt dự thi iKhiến tiếp theo”, anh Lưu Xuân Việt - đồng tác giả - chia sẻ sau khi nhận được kết quả cuộc thi.

Video quy trình hoạt động của hệ thống Copyright Detection System:

 

>> FPT Retail và FPT IS cùng đoạt giải Vàng iKhiến tháng 11

Sơn Thạnh

Ý kiến

()