Chúng ta

Thiếu hụt toàn cầu về nhân lực phân tích dữ liệu

Thứ hai, 29/6/2015 | 11:30 GMT+7

Sự bùng nổ về dữ liệu trong thời đại công nghệ thông tin cùng với phát triển của các phương thức kinh doanh tạo giá trị gia tăng nhờ dữ liệu, đang kéo theo sự thiếu hụt nghiêm trọng trên quy mô toàn cầu về nhân lực có khả năng phân tích dữ liệu.

Đây vừa là thách thức cho sự phát triển công nghệ thông tin trong trung hạn, nhưng cũng là cơ hội chưa từng có cho những người học ngành kỹ thuật, khoa học tự nhiên, toán học, công nghệ thông tin; và cho cả những người đang công tác trong nhưng lĩnh vực khác nhau nhưng có thể bổ túc thêm kiến thức và kỹ năng phân tích dữ liệu.

Hiện tại, các hoạt động của doanh nghiệp, người dùng, máy móc có thể sinh ra nhiều dữ liệu, đa dạng và liên tục. Lượng dữ liệu do người dùng toàn cầu tạo ra hằng ngày trên Facebooku là trên 600 Tetrabyte. Với mỗi chuyến bay của Boeing 787, các cảm biến của nó sinh ra và truyền về mặt đất lượng dữ liệu cỡ nửa Tetrabyte. Độc giả VnExpress tạo ra 80 gigabyte dữ liệu mỗi ngày, chỉ từ các click chuột trên trang web hoặc nhấn trên màn hình thiết bị di động trong lúc đọc báo.

Các dữ liệu này có thể mang lại nhiều hiểu biết sâu sắc về sản phẩm, dịch vụ, hoạt động vận hành của thiết bị, doanh nghiệp, hay hiểu biết về khách hàng, giúp doanh nghiệp có thể nhanh chóng phản ứng, điều chỉnh, tối ưu hóa hoạt động, tăng doanh thu và lợi nhuận, phục vụ và làm hài lòng khách hàng hơn.

H1ok-7729-1435547778.jpg

Các kỹ năng của các nhóm công việc liên quan đến lỹ thuật dữ liệu và khoa học dữ liệu.

Thập kỷ 2010 - 2020, chứng kiến một sự chuyển tiếp ngoạn mục về cung cầu trên thị trường lao động về các vị trí làm việc với phân tích dữ liệu.

Viện nghiên cứu của Accenture nhận định rằng, tại Mỹ 80% các công việc liên quan đến khoa học dữ liệu mới được sinh ra trong khoảng năm 2010 đến năm 2011 vẫn chưa tìm được ứng viên nhận nhiệm vụ. Cũng theo Accenture, Mỹ sẽ tạo ra 400.000 vị trí làm việc mới liên quan đến phân tích dữ liệu trong khoảng thời gian từ 2010 đến 2015, nhưng chỉ có thể tạo ra được 140.000 học viên tốt nghiệp mới đáp ứng được công việc.

Chỉ riêng sự thiếu hụt tại Mỹ đã vượt quá cả dư thừa tài năng được đào tạo của cả Trung Quốc và Ấn Độ cộng lại. Năm 2013, hãng SAP đã điều tra với 300 doanh nghiệp tại Anh và thấy 75% trong số đó thiếu hụt người có kỹ năng phân tích dữ liệu. Gartner cho rằng năm 2015, trên thế giới có 4,4 triệu việc làm mới liên quan đến dữ liệu lớn, trong đó có 1,9 triệu tại Mỹ, và chỉ có 1/3 số này tìm được người có năng lực đáp ứng.

McKinsey Global Institute dự đoán đến năm 2018 sẽ vẫn thiếu 140.000 - 190.000 người có đủ kỹ năng để tạo ra tri tức từ dữ liệu lớn. Sự thiếu hụt nhân lực này sẽ càng ngày càng trầm trọng, như biểu đồ thể hiện.

Lý do làm nên sự thiếu hụt nhân lực nằm ở chỗ các vị trí làm việc với phân tích dữ liệu phải hội tụ được nhiều kỹ năng cùng một lúc. Các vị trí này vừa phải nắm được các kỹ thuật thống kê và khai phá dữ liệu vừa phải biết lập trình và quản trị những lượng dữ liệu lớn, đa dạng về cấu trúc, tốc độ truyền tải nhanh. Ngoài ra, họ còn cần có hiểu biết về doanh nghiệp hoặc các ngành công nghiệp cụ thể, nơi các kết quả phân tích được ứng dụng. Để làm việc với giới doanh nghiệp không có nền tảng kỹ thuật, họ cần kỹ năng giao tiếp tốt, kỹ năng trình bày báo cáo dễ hiểu, dễ giúp doanh nghiệp ra quyết định. Số lượng người đáp ứng được nhiều kỹ năng như vậy sẽ không thể nhiều bằng số lượng những người chỉ có một trong số các kỹ năng trên.

H2ok-4488-1435547778.jpg

Biểu đồ thể hiện chênh lệch cung cầu trong nghề phân tích dữ liệu.

Để chống đỡ lại phần nào sự thiếu hụt nghiêm trọng về nhân lực làm nghề phân tích dữ liệu, một số doanh nghiệp phải tập hợp những người có từng kỹ năng riêng biệt lại để tự đào tạo nhau. Cũng đã xuất hiện các khóa học bổ túc tay nghề cho những người đi làm để nâng cấp họ đáp ứng được công việc phân tích dữ liệu, nhưng tỷ lệ chọi nhập học cho các khóa học này đang vẫn quá cao, thậm chí cao hơn cả tỷ lệ vào các trường danh giá như Havard.

Sự thiếu hụt nhân lực làm phân tích dữ liệu ở các nước lớn trên thế giới là cơ hội cho Trung Quốc, Ấn Độ, và ngay cả Việt Nam. Việt Nam là nước có nền tảng đào tạo toán học và các ngành khoa học tự nhiên tốt ở bậc phổ thông. Chương trình đào tạo toán bậc phổ thông của Việt Nam đòi hỏi học viên tốt nghiệp có kỹ năng toán học cao hơn so với học sinh nhiều nước. Tỷ lệ sử dụng máy tính và các thiết bị tính toán di động ở giới trẻ Việt Nam tăng nhanh. Chính phủ cũng đã đặt những mục tiêu chiến lược để biến Việt Nam trở thành một nước mạnh về công nghệ thông tin.

Đây có thể coi là thiên thời địa lợi cho giới trẻ Việt Nam hiện nay, để xây dựng một con đường nghề nghiệp về xử lý dữ liệu, với công việc hấp dẫn tại các quốc gia phát triển, không chỉ ở Mỹ, châu Âu, mà ngay cả ở Nhật, Hàn Quốc, hay gần hơn là Singapore.

Học sinh tốt nghiệp phổ thông trung học có thể học tiếp chương trình đại học theo các ngành trong công nghệ thông tin hoặc toán học ứng dụng, đặc biệt là các ngành như khoa học máy tính, kỹ thuật phần mềm. Học viên nên theo các chương trình cho phép có thời gian thực tập dài trong doanh nghiệp, để tham gia ngay vào các dự án phân tích dữ liệu thực tế hoặc ít nhất hiểu biết sâu hơn về thực tiễn, nhu cầu của một vài ngành công nghiệp nhất định. Các chương trình giảng dạy hoàn toàn bằng tiếng Anh, hoặc toàn bộ giáo trình bằng tiếng Anh sẽ tạo cho học viên lợi thế lớn, do tiếng Anh là điều kiện tiên quyết khi tham gia vào thị trường lao động toàn cầu.

Người đã tốt nghiệp đại học, đặc biệt là ngành liên quan đến toán học và công nghệ thông tin có thể bổ túc theo các chương trình thạc sĩ đào tạo về khai phá dữ liệu, đặc biệt là chương trình dạy bằng tiếng Anh, có học viên quốc tế cùng học và được thực tập thực tế trong các dự án khai phá dữ liệu của doanh nghiệp. Các chương trình như vậy không chỉ có ở những quốc gia phát triển như Hoa Kỳ, hay Singapore mà ở Việt Nam.

Có thể coi sự thiếu hụt nhân lực phân tích dữ liệu trên toàn cầu là cơ hội cho Việt Nam bứt phá, đi tắt đón đầu trong đào tạo nhân lực công nghệ thông tin, nhanh đạt đến mục tiêu nước mạnh về công nghệ thông tin.

4 công việc liên quan đến phân tích dữ liệu:

Kiến trúc sư dữ liệu: Là người nắm rõ cấu trúc, đặc tính của các nguồn dữ liệu, hiểu rõ yêu cầu sử dụng của các dự án phân tích dữ liệu, bao gồm nhu cầu ngắn hạn và nhu cầu mở rộng trong tương lai. Người này có khả năng đưa ra kế hoạch tổng thể cho việc thu thập, lưu trữ, tích hợp và bảo trì các nguồn dữ liệu này.

Kỹ sư dữ liệu: Là người hiểu biết sâu sắc về các hệ quản trị dữ liệu và hệ thống phần mềm liên quan, để có thể thực thi được các yêu cầu thiết kế của kiến trúc sư dữ liệu một cách hiệu quả. Kỹ sư dữ liệu cài đặt các cơ sở dữ liệu, viết các câu lệnh truy vấn dữ liệu phức tạp, mở rộng hệ lưu trữ ra trên nhiều máy tính hoặc thu gọn khi cần, xây dựng hệ thống phòng ngừa rủi ro để không mất dữ liệu khi có các sự cố hay thiên tai xảy ra...

Nhà phân tích dữ liệu: Nhiệm vụ chính là tính toán và đưa ra các kết luận có khả năng đúng cao, từ các con số. Họ thường có bằng cấp về ngành khoa học máy tính và kinh doanh. Họ sử dụng dữ liệu từ các hệ quản trị dữ liệu hoặc tập tin Excel, bảng tính của doanh nghiệp, để phân tích và đưa ra các nhận định có ý nghĩa cho hoạt động.

Nhà khoa học dữ liệu: Có nhiệm vụ giống như nhà phân tích dữ liệu, nhưng họ có kỹ năng để làm việc với dữ liệu lớn hoặc có tốc độ truyền dữ liệu về cao, từ nhiều nguồn khác nhau. Họ biết về kỹ thuật cơ sở dữ liệu, đặc biệt là kỹ thuật dữ liệu lớn như Hadoop hay Netezza, sử dụng các ngôn ngữ chuyên dụng cho phân tích dữ liệu như R hoặc ngôn ngữ cho phép dựng nhanh các ứng dụng phân tích dữ liệu như Python, và có kỹ năng về thống kê, khai phá dữ liệu.

Trần Thế Trung
Viện trưởng Viện Nghiên cứu Công nghệ FPT

Ý kiến

()