Chúng ta

Góc nhìn từ Google về Big Data

Chủ nhật, 22/11/2015 | 13:45 GMT+7

"Khi chưa tìm hiểu, có thể chúng ta nghĩ rằng Big Data rất rộng lớn, nặng nề, chậm chạp và phức tạp. Nhưng kỳ thực, Big Data thật tuyệt vời, nó làm cho mọi thứ trở nên gọn nhẹ, nhanh chóng và dễ dàng hơn rất nhiều", chuyên gia của Google - Felipe Hoffa - chia sẻ.

Seminar về Big Data do Trường Đào tạo Cán bộ FPT (FCU) phối hợp cùng Ban Công nghệ FPT (FTI) tổ chức tối ngày 19/11 tại tầng 13, tòa nhà FPT Cầu Giấy, Hà Nội, đã thu hút khoảng 150 người tham dự.

Diễn giả là Felipe Hoffa - chuyên gia công nghệ có 6 năm kinh nghiệm làm việc cho Google và hiện là Developer Advocate. Ông cũng đã thực hiện nhiều buổi thuyết trình về công nghệ ở hơn 17 quốc gia trên thế giới. 

Tại buổi seminar, diễn giả đã chia sẻ tổng quan về Google Big Data và các kiến trúc cơ bản, đồng thời thảo luận về điện toán đám mây. Qua đó, ông đã giúp người tham dự có được thông tin, kiến thức, kinh nghiệm chuyên sâu về Big Data và cái nhìn khái quát về những sản phẩm Google, đặc biệt là BigQuery.

go-1_1448020129.jpg

Theo Felipe Hoffa, Big Data có vai trò quan trọng với nền công nghệ thế giới hiện nay và trong tương lai.

Felipe cho biết, có ba bước lớn trong cuộc cánh mạng về dữ liệu đó là giá cả, truy cập và tốc độ. Google đang cho thấy những bước đi trưởng thành và mạnh mẽ trong lĩnh vực dữ liệu lớn với những sản phẩm mới được ra mắt gần đây như Google Drive và BigQuery. Chúng không còn là những dự án công nghệ nửa vời trong vỏ bọc các ứng dụng nữa mà đã trở thành các sản phẩm hoàn chỉnhCác yếu tố làm nên sự mạnh mẽ của Drive cũng được áp dụng vào BigQuery - công cụ phân tích số liệu lớn mới của Google. 

BigQuery là một công cụ của Google Developers cho phép truy vấn siêu nhanh các tập dữ liệu lớn. Người dùng có thể xuất dữ liệu phiên và lần truy cập từ tài khoản Google Analytics Premium sang BigQuery, sau đó sử dụng cú pháp giống SQL để truy vấn tất cả dữ liệu Analytics. Khi xuất dữ liệu sang BigQuery, người dùng sở hữu dữ liệu đó và có thể sử dụng ACL BigQuery để quản lý quyền trên các dự án và tập dữ liệu. Những người dùng trả phí cho BigQuery có thể phân tích đến hơn 7 TB dữ liệu thay vì mức 100 GB như thường lệ.

go-2.jpg

Felipe Hoffa chia sẻ về công cụ mới của Google mang tên BigQuery.

BigQuery nhắm đến giải quyết các vấn đề lớn, phức tạp mà người dùng không thể giải quyết. Sản phẩm này hướng đến khách hàng mục tiêu như các công ty tài chính, dược phẩm hoặc các phòng thí nghiệm gen - những đơn vị cần phân tích những khối lượng dữ liệu khổng lồ. 

Khi so sánh các công cụ hỗ trợ tìm kiếm và phân tích, ta có thể thấy rằng Google BigQuery khai phá dữ liệu nhanh chóng và đơn giản hơn rất nhiều. Ví dụ Google BigQuery sử dụng tìm kiếm theo chiều dọc để nén và đẩy nhanh quá trình tìm kiếm cho các bộ dữ liệu lớn và phi cấu trúc. Trong 10 giây BigQuery có thể tìm kiếm một đoạn chuỗi trong một bảng dữ liệu có khoảng 35 tỷ dòng và 20 TB.

Điều ấn tượng hơn là bất cứ ai có một tài khoản Google đều có thể sử dụng BigQuery. Ý tưởng của nó nhanh hơn các phương pháp tìm kiếm dữ liệu lớn khác. Ví dụ khi người dùng tải hình ảnh và đưa ảnh lên Google Images, họ sẽ thấy được tất cả các trang có hình ảnh của mình. Qua nhiều thử nghiệm khác, người ra đúc kết được, dữ liệu lớn sẽ giúp chúng ta "mò kim đáy bể" thông tin dễ dàng hơn trong mớ hỗn độn của dữ liệu phi cấu trúc.

"Khi chưa tìm hiểu, có thể chúng ta nghĩ rằng Big Data rất rộng lớn, nặng nề, chậm chạp và phức tạp. Những kỳ thực, Big Data thật tuyệt vời, nó làm cho mọi thứ trở nên gọn nhẹ, nhanh chóng và dễ dàng hơn rất nhiều", Felipe Hoffa đúc kết.

"Tôi thấy buổi chia sẻ của diễn giả khá hữu ích. Tôi đã tìm hiểu được nhiều điểm mới khá thú vị về truy vấn dữ liệu lớn trong thời gian ngắn. Đơn cử việc diễn giả chia sẻ, Google đã dự đoán chính xác kết quả 8 trận đấu bóng đá bằng máy học dữ liệu quá khứ và các thông tin trên mạng. Nếu điều này thực sự thành công và mở rộng sang các lĩnh vực khác thì sẽ rất có ích", anh Nguyễn Thành, ĐH FPT, cho hay.

Tử Quyên

Ý kiến

()