Chuyên viên phân tích dữ liệu lớn (60 giờ)

Chuyên viên phân tích dữ liệu lớn (60 giờ)


GIỚI THIỆU

Big Data là thuật ngữ dùng để chỉ một tập hợp dữ liệu rất lớn, với quy mô vượt quá khả năng nắm bắt và xử lý của các công cụ phần mềm truyền thống trong khoảng thời chấp nhận. Big Data còn là tập hợp các kỹ thuật và công nghệ đòi hỏi cách tích hợp mới nhằm khám phá những giá trị tiềm ẩn to lớn từ những tập hợp dữ liệu lớn, đa dạng, phức tạp. Năm 2012, Gartner định nghĩa “Dữ liệu lớn là những tài sản thông tin với ba chiều tăng trưởng (3V), tăng về lượng (volume), tăng về tốc độ (velocity), tăng về chủng loại (variety), do đó cần các hình thức xử lý mới để nâng cao khả năng ra quyết định, khám phá giá trị nội tại và tối ưu hóa quy trình làm việc”.

THỜI LƯỢNG ĐÀO TẠO

60 giờ

YÊU CẦU ĐẦU VÀO

  • Học viên cần có kiến thức cơ bản về ngôn ngữ lập trình Java, hệ điều hành Linux, và SQL
  • Học viên sử dụng Laptop cá nhân (RAM tối thiểu: Linux OS 4GB , Windows 6GB)


KIẾN THỨC VÀ KỸ NĂNG ĐẠT ĐƯỢC SAU KHI TỐT NGHIỆP

Sau khi hoàn tất khóa học, học viên sẽ nắm được những kiến thức và kỹ năng cần thiết về các framework sau:

  • Hadoop: là nền tảng nguồn mở viết bằng Java hỗ trợ xử lý và lưu trữ các tập dữ liệu cực lớn trên môi trường tính toán phân tán. Cốt lõi của Hadoop gồm phần lưu trữ (Hệ thống tập tin phân tán Hadoop – HDFS) và phần xử lý (MapReduce).
  • HBase: cơ sở dữ liệu phân tán, phi-quan hệ, nguồn mở viết bằng Java.
  • Hive: tiêu chuẩn để truy vấn SQL tương tác trên dữ liệu lớn trong Hadoop
  • Spark: là công cụ nguồn mở, có khả năng xử lý nhanh chóng, tiện dụng và phân tích. Nó có thể xử lý một lượng dữ liệu lớn với độ trễ thấp mà chương trình MapReduce thông thường không thể thực hiện.
  • Pig: công cụ/platform dùng để phân tích các tập dữ liệu lớn được biểu diễn dưới dạng data flows. Pig thường dùng chung với Hadoop. Chúng ta có thể thực hiện các thao tác dữ liệu trên Hadoop với Apache Pig.
  • Sqoop: công cụ có khả năng rút trích dữ liệu từ các kho dữ liệu phi-Hadoop, chuyển đổi dữ liệu thành định dạng Hadoop có thể xử lý và sau đó tải dữ liệu vào trong hệ thống tập tin HDFS.

NGÔN NGỮ GIẢNG DẠY

Tiếng Việt

ƯU ĐIỂM CHƯƠNG TRÌNH

  • Khóa học bao gồm 30% thời gian thảo luận lý thuyết và 70% thực hành.
  • Giáo trình gốc từ Học viện NIIT.


BẰNG CẤP/CHỨNG CHỈ

  • Học viên tham dự từ 70% thời lượng đào tạo trở lên và đạt bài kiểm tra cuối khóa (Module Test) >= 45% sẽ được cấp Chứng chỉ hoàn thành khóa học (Certificate of Competence) Chuyên viên phân tích Dữ liệu lớn (Big Data) do NIIT cấp.
  • Học viên tham dự từ 70% thời lượng đào tạo trở lên nhưng không tham dự bài kiểm tra cuối khóa, sẽ được cấp Chứng chỉ tham gia khóa học (Certificate of Participation) Chuyên viên phân tích Dữ liệu lớn (Big Data) do NIIT cấp.

CHÍNH SÁCH ƯU ĐÃI

Học viên đăng ký nhóm 3 được giảm 10%

 


Stt Module Nội dung
1 Hadoop,
HDFS &
MapReduce
  • Theoretical Basis of Big Data
  • Description of Hadoop Components
  • Introduction to Linux
  • Installation of Hadoop Cluster
  • Distributed File System
  • Hadoop IO
  • Deep Understanding of MapReduce
  • MapReduce Design Pattern
2 HBase
  • Introduction to HBASE
  • HBASE Installation
  • HBASE Fundamentals
3 Hive
  • HIVE Fundamentals
  • HIVE Management
  • HQL
  • Functions
  • Hive Optimization
4 Spark
  • Spark Basics
  • Spark Installation
  • Working With RDD
  • Spark SQL
5 Pig
  • Objectives of Pig - data flow language
  • Pig Architecture
  • Pig Execution modes
  • Data Model and Installation of Pig
  • Pig processing - Loading and Transforming data
  • Built In Functions of Pig
  • Filtering, Grouping, Sorting Data
  • Relational Join Operators
  • Shell and Utility Commands in Pig
  • Pig User Defined Functions
6 Sqoop
  • Sqoop Fundamentals
  • Sqoop API

Download Brochure

Ngày khai giảng Giờ học Địa điểm Chọn đăng ký
10-10-2017 18h00 - 21h00 Cao Thắng Đăng ký


Không thể học thời gian trên? Chọn thời gian bạn có thể học
Chọn ngày Chọn giờ
Đăng ký


























Gửi câu hỏi
Về đầu trang