Thu thập dữ liệu

Lưu trữ xử lý phân tích luồng

Phân loại, tìm ý nghĩa trong dữ liệu

Devbig20 - Bigdata mở rộng 02 - Xử lý ngôn ngữ tự nhiên với dữ liệu lớn

Mục tiêu khoá học

  • Trở thành chuyên gia xử lý dữ liệu ngôn ngữ tự nhiên từ dữ liệu TEXT, khối lượng lớn (GB, TB, PB) qua các công đoạn:
    • Làm sạch
    • Segment
    • POS
    • NER

Giảng viên

Phạm Tuấn Anh (Mr.) 

Thạc sỹ ISTQB. CV giảng viên: dathoc.net/cv


Thời lượng khoá học

8 giờ xem clips. Học và thực hành tương đương 2 tuần.


Học phí khoá họcCần tài trợ tự nguyện tại đây.

Học thử (cần đăng ký thành viên)Xem link

DemoXem link
Xem phổ nghề của ngành, thu nhập dự kiến công việc tại Việt Nam: Xem link


Đối tuợng khoá học

Học sinh sinh viên đang học tập tại các Trường Đại học, PTTH.

Học sinh sinh viên đang học tập tại các chuyên ngành CNTT.

Học sinh sinh viên yêu thích CNTT.

Các bạn trẻ yêu thích lập trình, đang học tập hoặc đi làm.


Yêu cầu kiến thức, trang thiết bị trước khi học

Có máy tính/pc/laptop + internet + tai nghe, mic, thành thạo xem tra cứu thông tin trên web và internet.

Cần kỹ năng tổng hợp kiến thức đã học.

Cập nhật, tìm hiểu trước các kiến thức chuyên ngành tại link này.

Có khả năng gõ chữ trên máy tính (typing) 10 ngón là khuyến khích.

Có khả năng lập trình là khuyến khích, hoặc phải học thêm khi làm bài tập lớn về blockchain, bigdata, ai.

Khuyến khích khả năng đọc hiểu ngoại ngữ Tiếng Anh.

Bạn biết căn bản về kiến trúc ứng dụng, và xây dựng ứng dụng BigData (cần học qua Khoá BASDE06)


Kiến thức thu nhận sau khoá học

Biết về quy trình thu thập dữ liệu nlp, ra quyết định trên dữ liệu lớn. Biết các lý thuyết xử lý nlp

Biết streaming và phân tích trên dòng stream dữ liệu

Biết crawling data mở rộng, làm sạch dữ liệu

Biết lập trình java với segment, pos từ ngữ

Biết lập trình java với ner từ ngữ

Biết lập trình Scala với thư viện Spark mở rộng với map/filter/hàm tự tạo

Biết áp dụng thuật toán nmap, svm, tổ hợp từ ngữ, mapping audio, processes khac

Biết tổng hợp kết luận đưa ra công thức ra quyết định


Chi tiết học phần (từng mục học phần, buổi, ngày học) Xem chi tiết tại đây


Cách thức học

Học là trực tuyến, các tài nguyên học đều đã có trên đây và học viên tự sắp xếp thời gian phù hợp để học. Nhanh mất 3 ngày/khoá. Chậm mất 2-3 tuần/khoá.

Học viên cần xem clip học, làm theo clip học, thực hành như clip hướng dẫn.

Nếu có khó khăn, học viên đặt câu hỏi qua Chat 24/7 hoặc gửi mail cho Giảng viên.

Các bài tập sẽ được xác nhận và được kiểm tra nếu học viên làm đầy đủ và nộp bài.

Cuối khoá học sẽ có thi chứng chỉ. Và chứng chỉ chỉ được cấp nếu học viên thi cuối khoá pass.

Sau khi tốt nghiệp khoá học (có chứng chỉ) học viên sẽ được trung tâm giới thiệu việc làm vào các doanh nghiệp cùng ngành nghề.


Khoá học khác bổ sung

BAS00 - Đạo đức nghề nghiệp trong ngành Công nghệ thông tin

BASDEplus- Kỹ năng bổ sung cho Dev

BASTEplus - Kỹ năng bổ sung cho tester newbie

BASDE14 - AWS Khái niệm và thực hành

BASDE06- Kiến trúc và xây dựng BigData

BASTE01 - Kiểm thử viên cơ bản 


Khoá học khác tham khảo

ADVTE03b - Kiểm định tự động cho mobile/ Mobile automation test

Cap301 - Đồ án, bài tập lớn về bigdata

BigData mở rộng 01: Thu thập, dự đoán, ra quyết định trên dữ liệu lớn - devbig19 

Aidev01 - Chatbot với voice Tiếng Việt

Bizda301 - Cơ bản phân tích dữ liệu dự đoán, ra quyết định cho doanh nghiệp



Devbig19 - BigData mở rộng 01: Thu thập, dự đoán, ra quyết định trên dữ liệu lớn

Mục tiêu khoá học

  • Mở rộng kiến thức về thu thập dữ liệu (web, storage, mọi nơi...) qua: Java + Webdriver, Nifi
  • Phân loại, tìm kiếm, xử lý theo thuật toán để dự đoán ra quyết định trên dữ liệu (text, file) qua Hadoop -HDFS, Spark Mllib
  • Chuyển đổi hệ thống dữ liệu cũ sang kiến trúc dữ liệu lớn mã nguồn mở HDFS.


Giảng viên

Phạm Tuấn Anh (Mr.) 

Thạc sỹ ISTQB. CV giảng viên: dathoc.net/cv


Thời lượng khoá học

8 giờ xem clips. Học và thực hành tương đương 2 tuần.


Học phí khoá họcCần tài trợ tự nguyện tại đây.

Học thử (cần đăng ký thành viên)Xem link

DemoXem link
Xem phổ nghề của ngành, thu nhập dự kiến công việc tại Việt Nam: Xem link


Đối tuợng khoá học

Học sinh sinh viên đang học tập tại các Trường Đại học, PTTH.

Học sinh sinh viên đang học tập tại các chuyên ngành CNTT.

Học sinh sinh viên yêu thích CNTT.

Các bạn trẻ yêu thích lập trình, đang học tập hoặc đi làm.


Yêu cầu kiến thức, trang thiết bị trước khi học

Có máy tính/pc/laptop + internet + tai nghe, mic, thành thạo xem tra cứu thông tin trên web và internet.

Cần kỹ năng tổng hợp kiến thức đã học.

Cập nhật, tìm hiểu trước các kiến thức chuyên ngành tại link này.

Có khả năng gõ chữ trên máy tính (typing) 10 ngón là khuyến khích.

Có khả năng lập trình là khuyến khích, hoặc phải học thêm khi làm bài tập lớn về blockchain, bigdata, ai.

Khuyến khích khả năng đọc hiểu ngoại ngữ Tiếng Anh.

Bạn biết căn bản về kiến trúc ứng dụng, và xây dựng ứng dụng BigData (cần học qua Khoá BASDE06)


Kiến thức thu nhận sau khoá học

Biết các lý thuyết thống kê cơ bản và mở rộng để dự đoán số liệu lớn

Biết streaming và phân tích trên dòng stream dữ liệu, qua Nifi

Biết crawling data mở rộng với mẫu script có sẵn,qua Java + Webdriver

Biết lập trình Scala với thư viện Spark mở rộng với map/filter/hàm tự tạo

Biết áp dụng thuật toán logistic regression, random forest, dự đoán dữ liệu, qua Spark Mllib

Biết áp dụng thuật toán svm, time series dự đoán dữ liệu, qua Spark Mllib

Biết áp dụng thuật toán neural network, dự đoán dữ liệu, qua Spark Mllib

Biết tổng hợp kết luận đưa ra công thức ra quyết định

Biết chuyển đổi kiến trúc lưu trữ dữ liệu hiện tại (MS SQL, MySQL, Oracle...) quá tốn kém và chậm, và chuyển sang kiến trúc dữ liệu lớn mã nguồn mở Hadoop -HDFS


Chi tiết học phần (từng mục học phần, buổi, ngày học) Xem chi tiết tại đây


Cách thức học

Học là trực tuyến, các tài nguyên học đều đã có trên đây và học viên tự sắp xếp thời gian phù hợp để học. Nhanh mất 3 ngày/khoá. Chậm mất 2-3 tuần/khoá.

Học viên cần xem clip học, làm theo clip học, thực hành như clip hướng dẫn.

Nếu có khó khăn, học viên đặt câu hỏi qua Chat 24/7 hoặc gửi mail cho Giảng viên.

Các bài tập sẽ được xác nhận và được kiểm tra nếu học viên làm đầy đủ và nộp bài.

Cuối khoá học sẽ có thi chứng chỉ. Và chứng chỉ chỉ được cấp nếu học viên thi cuối khoá pass.

Sau khi tốt nghiệp khoá học (có chứng chỉ) học viên sẽ được trung tâm giới thiệu việc làm vào các doanh nghiệp cùng ngành nghề.


Khoá học khác bổ sung

BAS00 - Đạo đức nghề nghiệp trong ngành Công nghệ thông tin

BASDEplus- Kỹ năng bổ sung cho Dev

BASTEplus - Kỹ năng bổ sung cho tester newbie

BASDE14 - AWS Khái niệm và thực hành

BASDE06- Kiến trúc và xây dựng BigData

BASTE01 - Kiểm thử viên cơ bản 


Khoá học khác tham khảo

ADVTE03b - Kiểm định tự động cho mobile/ Mobile automation test

Cap301 - Đồ án, bài tập lớn về bigdata

BigData mở rộng 01: Thu thập, dự đoán, ra quyết định trên dữ liệu lớn - devbig19 

Aidev01 - Chatbot với voice Tiếng Việt

Bizda301 - Cơ bản phân tích dữ liệu dự đoán, ra quyết định cho doanh nghiệp