Chúng ta

Cuộc cách mạng Big Data

Thứ năm, 6/12/2012 | 18:02 GMT+7

Tập đoàn FPT không thể đứng ngoài cuộc chơi Big Data khi việc khai thác dữ liệu lớn đang bùng nổ ở tất cả các lĩnh vực trên toàn thế giới.
> FPT chạm tay vào dữ liệu lớn

Obama vừa tái đắc cử vị trí Tổng thống Mỹ nhiệm kỳ lần thứ hai. Người ta đã phân tích những yếu tố mang đến thắng lợi cho vị tổng thống da màu này và phát hiện, đằng sau thành công của ông có bóng dáng của dữ liệu lớn.

Qua Facebook, Twitter và nhiều nguồn online khác nhau, các cộng sự của Obama đã xây một chiến dịch không mệt mỏi nhằm tạo ra một cơ sở dữ liệu chứa tiểu sử riêng của cử tri tiềm năng. Những dữ liệu khổng lồ đó đã chỉ cho Obama cách tìm cử tri ủng hộ và thu hút sự chú ý của họ, đồng thời cho phép nhà phân tích chạy các thử nghiệm dự đoán nhóm đối tượng có thể bị thuyết phục bởi những dạng thức thu hút nào.

Lượng dữ liệu khổng lồ cũng cho phép chiến dịch thu được nhiều tiền hơn dự tính ban đầu. Cho đến tháng 8, những người đứng về phía Obama đã lớn tiếng phản bác về khả năng thu được 1 tỷ USD là không tưởng. Vậy mà chỉ sau một mùa hè, mọi thứ đã thay đổi.

Chiến thắng của Tổng thống Mỹ Obama và lời kỷ nguyên của dữ liệu trong chính trị. Ảnh: Internet.

Chiến thắng của Tổng thống Mỹ Obama và lời kỷ nguyên của dữ liệu trong chính trị. Ảnh: Internet.

Những thủ thuật kỳ diệu để làm khách hàng mở hầu bao được áp dụng triệt để cho việc bỏ phiếu. Đội ngũ phân tích sử dụng 4 dòng dữ liệu chính để xây dựng nên một bức tranh chi tiết nhất về cử tri ở các bang trọng yếu.

Dữ liệu được xử lý liên tục hằng đêm và được đưa vào hệ thống cho mọi khả năng có thể xảy ra. Các máy tính đã chạy tới 66.000 lần vòng bầu cử mỗi đêm để tìm ra tỷ lệ chiến thắng của Obama cho mỗi bang trung lập. Vào mỗi buổi sáng, họ sẽ nhận được kết quả và biết được khả năng chiến thắng trong các bang đó cũng như cách phân bổ nguồn lực phù hợp…

Có thể nói, chiến thắng của Obama là dấu hiệu cảnh báo sớm về những chiến dịch mang tính cảm quan và kinh nghiệm trên chính trường Washington sẽ sớm được thay thế bằng công việc của các lập trình viên máy tính và chuyên gia về số liệu. Giờ đây trong chính trị, kỷ nguyên của dữ liệu đã bắt đầu.

Trước đó, vào tháng 3/2012, Nhà trắng đã chi 250 triệu USD cho 84 chương trình về Big Data dùng cho 6 bộ. Cũng trong năm nay, Bộ Văn hóa - Giáo dục Nhật Bản đã đưa ra nghiên cứu về dữ liệu lớn và nghiên cứu thảm họa.

Không chỉ khối nhà nước mạnh tay chi ngân sách cho dữ liệu lớn mà các doanh nghiệp cũng nhanh nhạy dùng dữ liệu làm cơ sở cho hoạt động kinh doanh. Hãng bán lẻ hàng đầu Mỹ - Walmart - đang khai thác triệt để dữ liệu từ các mạng xã hội thời gian thực để biết xu hướng và dùng chúng trong quảng cáo trực tuyến, nhằm mang lại hiệu quả cao nhất.

Thập niên tới sẽ là cuộc cách mạng của dữ liệu lớn. Ảnh: S.T.

Thập niên tới sẽ là cuộc cách mạng của dữ liệu lớn. Ảnh: S.T.

Hiện tại, một số công ty nổi tiếng về chế tạo về phần cứng trong quá khứ dần thay đổi thành công ty cung cấp dịch vụ, như phân tích kinh doanh. IBM đang đầu tư hàng tỷ USD trong việc xây dựng và cố gắng dẫn đầu trong việc phân tích kinh doanh.

Gã khổng lồ tìm kiếm Google là một minh chứng khác về thành công trong việc xử lý dữ liệu lớn. Google hiểu rất rõ quản lý và xử lý như thế nào các dữ liệu khổng lồ ở mức lớn hơn các công ty khác có thể làm. Họ đã xây dựng được công nghệ riêng nhằm phân tích nhanh và tương tác những dữ liệu khổng lồ.

Hãng nghiên cứu IDC cho biết, thị trường công nghệ và dữ liệu lớn đạt 3,2 tỷ USD trong năm 2010 và đang phi mã 16,9 tỷ USD vào năm 2015.

Theo Gartner, trong 5 năm tới, thế giới sẽ chi 232 tỷ USD cho Big Data. Trong đó, lĩnh vực tài chính ngân hàng đang chiếm đến 25% yêu cầu về xử lý dữ liệu lớn, sau đó đến lĩnh vực dịch vụ, truyền thông (15%) và chính phủ (12%). Khu vực Bắc Mỹ chiếm đến 59% yêu cầu về xử lý dữ liệu lớn, sau đó là châu Âu (19%), châu Á - Thái Bình Dương (17%) và châu Phi (4%).

FPT ví Big Data là một trong 3 mái chèo của mình trong dòng chảy công nghệ. Chủ tịch HĐQT kiêm TGĐ FPT Trương Gia Bình khẳng định, thập niên tới sẽ là cuộc cách mạng của dữ liệu lớn.

FPT đã xác định cơ hội của mình trong chiến lược CNTT như hạ tầng của hạ tầng. Cùng với lượng người được phục vụ đông đảo, trên hạ tầng này, thông tin sẽ được sinh ra và sử dụng với số lượng rất lớn. Đây sẽ là nguồn tài nguyên mà FPT cần tận dụng tối đa cho sự phát triển nhanh và bền vững trong tương lai.

FPT Online đã có những động thái sử dụng và khai thác dữ liệu lớn phục vụ cho khách hàng và kinh doanh. Ảnh: L.T.

FPT Online đã có những động thái sử dụng và khai thác dữ liệu lớn phục vụ cho khách hàng và kinh doanh. Ảnh: L.T.

Các công ty làm việc với số lượng khách hàng lớn như FPT Online, FPT Telecom, FPT Trading... đều có thể tạo ra những giá trị khác biệt và sản phẩm mới, cá nhân hóa đến từng khách hàng. Các công ty có thể tối ưu hóa lợi nhuận, dựa trên việc phân tích hành vi, sở thích, nhu cầu của khách hàng bằng công nghệ thu nhập, lưu trữ và xử lý khối lượng khổng lồ thông tin của họ.

FPT Online hiện sở hữu một số lượng khách hàng khá lớn với hơn 30 triệu pageview và hơn 10 triệu độc giả truy cập VnExpress.net mỗi ngày và hàng triệu game thủ. Đơn vị đang có những động thái sử dụng và khai thác dữ liệu này không chỉ phục vụ nhu cầu của độc giả mà còn đưa ra những hướng kinh doanh mới.

e.Click là sản phẩm chiến lược của FPT Online trong lĩnh vực quảng cáo, được xây dựng trên cơ sở phân tích cơ sở dữ liệu nhằm đưa ra thông tin, sản phẩm phù hợp với nhu cầu của độc giả.

Viện trưởng Viện Công nghệ FPT kiêm thành viên Hội đồng Công nghệ Trần Thế Trung đánh giá: “FPT IS, FPT Software… cũng cần nắm bắt công nghệ này để đưa vào các sản phẩm dành cho đối tượng tiềm năng là doanh nghiệp có lượng khách hàng khổng lồ hoặc tổ chức của chính phủ phục vụ số lượng lớn dân cư”.

Với việc xác định Big Data là xu thế không thể đảo ngược, có những đầu tư nhất định, FPT đang sẵn sàng đón nhận những cơ hội lớn mà công nghệ này mang lại trong tương lai.

Thuật ngữ Big Data (dữ liệu lớn) chỉ những tập hợp dữ liệu phát triển nhanh chóng và rộng khắp dưới nhiều hình thức khác nhau, làm cho chúng vượt quá khả năng xử lý của những hệ thống cơ sở dữ liệu truyền thống. Mỗi ngày, chúng ta tạo ra 2,5 triệu quintillion (10 lũy thừa 30 tương đương 1030 tỷ tỷ bytes dữ liệu. Khối lượng dữ liệu mới được tạo ra nhiều và nhanh đến mức mà hai năm gần đây nhất chiếm đến 90% khối lượng dữ liệu trên thế giới.

Những dữ liệu này tới từ mọi nơi - ví dụ như từ những chiếc cảm biến để thu thập thông tin thời tiết, thông tin được cập nhật trên các trang web mạng xã hội, những bức ảnh và video kỹ thuật số được đưa lên mạng, dữ liệu giao dịch của các hoạt động mua sắm trên mạng... dưới mọi hình thức khác nhau (có cấu trúc, phi cấu trúc, bán cấu trúc).

Dữ liệu lớn có ba đặc trưng cơ bản: dung lượng lớn, vận tốc lớn và tính đa dạng.

Dữ liệu lớn không chỉ là thách thức dành cho tổ chức và doanh nghiệp, mà hơn thế còn là cơ hội để tìm kiếm thông tin chiến lược từ những dạng dữ liệu mới, để bảo đảm rằng công việc kinh doanh bền vững, có hiệu quả hơn và cũng là cơ hội để tìm ra câu trả lời cho những vấn đề mà trước đây chưa có lời giải đáp.

Triệu Mẫn

Ý kiến

()