Kiến thức chuyên ngành

Tập hợp các kiến thức chuyên ngành của các NGHỀ, từ sách, nhà truờng dạy.

Học viên tham khảo NGHỀ để đối chiếu KỸ NĂNG với nội dung kiến thức đuợc dạy trong môn học:

  1. NGHỀ Xây dựng nền tảng chuỗi khối - Blockchain network
  2. NGHỀ Xây dựng ứng dụng chuỗi khối - Blockchain application
  3. NGHỀ Khai phá dữ liệu - Data mining
  4. NGHỀ Phân tích dữ liệu-  Data analysis
  5. NGHỀ Thu thập dữ liệu- Data crawling
  6. NGHỀ Xây dựng ứng dụng Máy học, học sâu - Machine learning, deeplearning
  7. NGHỀ Xây dựng ứng dụng Trí tuệ nhân tạo - AI
  8. NGHỀ Xây dựng ứng dụng dữ liệu lớn - Bigdata application
  9. NGHỀ Kiểm tra phần mềm công nghệ thông tin - Software testing

Đối chiếu KỸ NĂNG từ Sách & Tài liệu:

  1. Sách về Data analysis, Data engineering: dathoc.net/bookda
  2. Sách về Data visualization engineering: dathoc.net/bookvis
  3. Sách về Machine learning engineering: dathoc.net/bookml
  4. Sách về Bigdata engineering: dathoc.net/bookbig
  5. Sách về Blockchain engineering: dathoc.net/bookbc
  6. Sách về Software testing: dathoc.net/booktest
  7. 390 Springer books all enterprise sectors and subjects: dathoc.net/spr

Đối chiếu KỸ NĂNG từ các Đại học quốc tế và Việt Nam:

  1. Harvard Uni
  2. Stanford Uni
  3. Dunia India Uni
  4. Vin Uni
  5. Bach Khoa Uni

Demo: dathoc.net/demo

Skillz

Contents

Kỹ năng mềm - SoftSkills [edit]

  1. Hiểu về Cách mạng CNTT 4.0 (đọc bài này)
  2. Hiểu về Đạo đức trong công việc, nghề nghiệp CNTT (xem series clip này: https://www.youtube.com/watch? v=Gcv5gz5rUw4)
  3. Kỹ năng thuyết trình (xem clip:https://www.youtube.com/watch? v=dEDcc0aCjaA , chuyển phụ đề sang Tiếng Việt)
  4. Kỹ năng gõ bàn phím máy tính 10 ngón (xem clip này:https://www.youtube.com/watch? v=S4yDnYbOAJs )
  5. Kỹ năng Tiếng Anh đọc hiểu cho dân CNTT (đọc bài này)
  6. Kỹ năng bóc tách giải quyết nút thắt bài toán, vấn đề (xem clip:https://www.youtube.com/watch? v=QOjTJAFyNrU, chuyển phụ đề sang Tiếng Việt)
  7. Kỹ năng trình bày văn bản trên MS Word, LibreOffice (ví dụ mẫu một văn bản hoàn thiện)
  8. Kỹ năng viết lý lịch, CV gửi tuyển dụng (cần viết ngắn, rõ ràng theo mẫu này)
  9. Kỹ năng lắng nghe và hồi đáp khi được phỏng vấn tuyển việc làm (xem clip này:https://www.youtube.com/watch? v=CP_0DqhQ81)
  10. Kỹ năng kìm nén cơn giận, nhẫn nại lắng nghe trong bàn luận nhóm, xúc tiến công việc (xem clip:https://www.youtube.com/watch? v=CqgmozFr_GM, chuyển phụ đề sang Tiếng Việt)

Kỹ năng cho Software Tester [edit]


  1. Sách tài liệu cho Kỹ sư kiểm tra kiểm thử phần mềm, software tester: https://dathoc.net/booktest
  2. CƠ BẢN - xem 35 clips YouTube: https://www.youtube.com/watch? v=scL5p8mkzuU&list= PL751V5I3RIDFDzGntQmwRi5zvjW1tirIF
    • Đọc hiểu yêu cầu khách hàng
    • Phân tích yêu cầu khách hàng ra yêu cầu kiểm thử phần mềm
    • Lập các chiến lược kiểm định
      • Chiến lược cho kiểm định đơn vị - Unit Test
      • Chiến lược cho kiểm định tích hợp - Integration Test
      • Chiến lược cho kiểm định API, Webservice - API Test
      • Chiến lược cho kiểm định chức năng - Functional Test
      • Chiến lược cho kiểm định giao diện người dùng - GUI Test
      • Chiến lược cho kiểm định hiệu năng - Performance Test/ Load Test/ Stress Test
      • Chiến lược cho kiểm định bảo mật - Security Test/ Penetration Test
      • Chiến lược cho kiểm định chuyển giao sản phẩm - Acceptance Test
    • Viết trường hợp kiểm định (testcase)
    • Thực hiện kiểm định
    • Ghi nhận lỗi, báo cáo số lượng lỗi sau kiểm định
    • Báo cáo cơ bản sau thực hiện kiểm định
  3. MỞ RỘNG
  • Ước lượng thời gian và số lượng công việc
  • Lập kế hoạch kiểm định
  • Phân tích rủi ro
  • Phân tích xu hướng lỗi xảy ra trong chu kỳ phát triển phần mềm
  • Áp dụng các công cụ vào thực hiện kiểm định để tăng năng suất - xem series clip Selenium Webdriver: https://www.youtube.com/watch? v=-uqX2-npxjo&list=PL751V5I3RIDH4RzUWGCQ1NhXuO2sCb-G3 
    • Áp dụng các công cụ vào thực hiện kiểm định tự động
    • Áp dụng các công cụ vào thực hiện kiểm định bảo mật
    • Áp dụng các công cụ vào thực hiện kiểm định API
    • Áp dụng các công cụ vào thực hiện kiểm định hiệu năng
    • Áp dụng các công cụ vào thực hiện kiểm định unit test
Các bài viết hay:
  1. Biểu mẫu, testcase mẫu phục vụ software testing: dathoc.net/booktest, folder test_process, folder template
  2. Quy trình kiểm định phần mềm: dathoc.net/booktest, folder test_process
  3. Về thiết kế TestCase: https://dathoc.net/mod/forum/discuss.php?d=133
  4. Log bug sao cho hiệu quả: https://dathoc.net/mod/forum/discuss.php?d=138
  5. Về kiểm định hiệu năng: https://dathoc.net/mod/forum/discuss.php?d=132
  6. Về SOA API testing: https://dathoc.net/mod/forum/discuss.php?d=134
  7. 10 lưu ý quan trọng trong scripting automation testing: https://dathoc.net/mod/forum/discuss.php?d=137
  8. Lưu ý quan trọng trong UI, UX testing: https://dathoc.net/mod/forum/discuss.php?d=131
  9. Về game testing: https://dathoc.net/mod/forum/discuss.php?d=83, phần kỹ sư test game
  10. Về lập kế hoạch TestPlan: https://dathoc.net/mod/forum/discuss.php?d=143
  11. Về nghề BA: https://dathoc.net/mod/forum/discuss.php?d=135
  12. Về Data Analysis & Bigdata testing: https://dathoc.net/mod/forum/discuss.php?d=141


[edit]

Kỹ năng cho Data Engineer [edit]

(Về các khoá học, tham khảo ảnh dưới)
  1. Sách tài liệu cho Kỹ sư Xử lý dữ liệu (DE - Data Engineering) thu thập dữ liệu (Crawler), khai phá (Mining): https://dathoc.net/bookda, dathoc.net/bookbig
  2. CƠ BẢN (xem 1 ngày làm việc của kỹ sư DE và học khóa BASDE06- Kiến trúc và xây dựng BigData)
    • Đọc hiểu yêu cầu khách hàng
    • Phân tích yêu cầu khách hàng ra yêu cầu xử lý dữ liệu (dữ liệu lớn, dữ liệu vừa), xem clip: https://youtu.be /znmmJIqYIfU?list=PL751V5I3RIDGN0bykK6hi8nsGu6PHb4bY&t=144
    • Lập các chiến lược xử lý dữ liệu
      • Tạo chu trình chung vào/ra xuyên suốt khi xử lý dữ liệu - data pipeline - xem dathoc.net/bookbig, 2017-pro-hadoop, chapter 5
      • Tham khảo kỹ thuật: cách thức thu thập dữ liệu - xem series clip: https://www.youtube.com/watch? v=oqspeRCFIRc&list=PL0ANjPcxElLj-8RPcC6joJOE-UNuvtTfD
      • Tham khảo kỹ thuật: cách thức làm sạch, chuyển đổi dữ liệu - xem dathoc.net/bookbig,  Best Practices in Data Cleaning
      • Tham khảo kỹ thuật: cách thức lưu trữ thu thập, gán nhãn ảnh: tra Google Yolov5 và guideline, tự sưu tập tự train mô hình, tự nhận diện
      • Tham khảo kỹ thuật: cách thức lưu trữ thu thập, gán nhãn text: xem dathoc.net/bookbig,Natural Language Processing Recipes, Google xem vnnlpcore, vn.tik, da co train mô hình, tự classify
      • Tham khảo kỹ thuật: cách thức lưu trữ thu thập, gán nhãn âm thanh: xem series https://www.youtube.com/watch? v=fMqL5vckiU0&list=PL-wATfeyAMNrtbkCNsLcpoAyBBRJZVlnf (bật chuyển Tiếng Việt)
      • Tham khảo kỹ thuật: cách thức lưu trữ từng loại dữ liệu - xem dathoc.net/bookbig, 2017-pro-hadoop, chapter 4
      • Tham khảo kỹ thuật: các thuật toán đã có áp dụng dự đoán, phân loại dữ liệu (cho unsupervised/supervised data) - xem dathoc.net/bookbig, 2017-pro-hadoop, chapter 7
      • Tham khảo kỹ thuật: các kỹ thuật cảnh báo tiến trình, xử lý tiến trình, cảnh báo tài nguyên trong quá trình xử lý - xem dathoc.net/bookbig, 2017-pro-hadoop, chapter 8
      • Tham khảo kỹ thuật: cách thức thể hiện view, visualize dữ liệu sau dự đoán, cho các đầu cuối - xem dathoc.net/bookbig, 2017-pro-hadoop, chapter 10
      • Tham khảo kỹ thuật visualization: xem dathoc.net/bookbig, excel visualize, r visualize, python plot visual, canvas.js, d3.js, chart.js, tableau, power bi
    • Chuẩn bị kiến thức lập trình xử lý dữ liệu
      • Lập trình cơ bản với ngôn ngữ python, java, scala - xem dathoc.net/bookbig, Beginning Spark 2
      • Lập trình cơ bản với thư viện, database: Spark, CouchBase, Parquet, Pandas, Numpy, OpenCV... - xem dathoc.net/bookbig, Advance data analytics with Python
    • Chuẩn bị máy móc, môi trường làm việc
      • Tạo cấu hình máy và môi trường nên đi thuê (xem bài này)
    • Thu thập dữ liệu
      • Kỹ thuật bash script Linux: xem dathoc.net/bookbig, carte-ref-Ubuntu-vi, bash_cheat_sheet
      • Kỹ thuật truy vấn SQL: xem Google w3school, sql
      • Kỹ thuật truy vấn phân tán - clustering/distributed query - xem dathoc.net/bookbig, Presto, Couchbase, Scylla
      • Kỹ thuật lưu chuyển live stream - xem dathoc.net/bookbig, Pro Hadoop, chap 3, Spark, Heron, Nifi, Kafka
      • Kỹ thuật lưu chuyển batch, vd:
        • Apache Kafka: Pubsub nhiều ng hay dùng, mọi loại data. Song với một số DB khó tích hợp.
        • Apache Nifi: Ứng dụng pubsub GUI dễ dùng, miễn phí, và dễ tích hợp bất cứ đâu, etl data từ nơi này sang nơi khác, batch, realtime
        • Apache Sqoop: Chỉ cho dữ liệu cấu trúc, dành riêng cho MS SQL etl sang HDFS
        • Apache Flume: Stream phi cấu trúc cho HDFS or Hbase.
        • RabbitMQ: Message Queuing System (MQ), huyền thoai pubsub, bất kỳ loại data nào. Thông thường <250kb.
        • Amazon Kinesis: Có phí, đối thủ của Kafka.
        • Microsoft Azure Event Hubs: Là Kafka từ Microsoft.
        • Google Pub/Sub: Là Kafka từ Google.
      • Kỹ thuật lưu trữ phân tán - sử dụng định dạng hdfs
      • Kỹ thuật phân loại lưu trữ với loại cơ sở dữ liệu phù hợp, xem dathoc.net/bookbig, Performance comparison of different file formats and storage engines, vd:
        • hbase
        • parquet
        • avro
        • kudu
      • Kỹ thuật phân loại lưu trữ theo công nghệ lưu chuyển:  xem https://spark.apache.org/docs/2.2.0/streaming-kafka-0-10-integration.html; xem: https://stackshare.io/stackups/heron-vs-kafka
      • Kỹ thuật dựng datalake, dựng datawarehouse: xem dathoc.net/bookbig, 2019_bigdatawarehouse
  1. Tiền xử lý dữ liệu
    • Làm sạch tạo câu dữ liệu: text
    • Cắt tạo khung ảnh phù hợp đối tượng (tag img): hình ảnh
    • Xuất thông số âm thanh
    • Kỹ thuật chuyển đổi map/reduce (hẹp, rộng, lọc, tổng hợp)
  2. Xử lý dữ liệu
    • Kỹ thuật xử lý tạm trên RAM
    • Kỹ thuật chuyển đổi map/reduce (hẹp, rộng, lọc, tổng hợp .... spark map/reduce, pig map/reduce, impala)
    • Kỹ thuật truy vấn phân tán (select, n1ql..impala, presto, couchbase)
    • Kỹ thuật sử dụng thuật toán giám sát (logistic regression, timeseries..)
    • Kỹ thuật sử dụng thuật toán không giám sát (knn, autoencoders, deep belief nets...)
    • Kỹ thuật sử dụng mạng nhân tạo feed forward - CNN
    • Kỹ thuật sử dụng mạng nhân tạo feed replay - RNN
    • Kỹ thuật sử dụng xử lý lưu trữ bộ nhớ ngắn hạn - LSTM
    • Kỹ thuật sử dụng mạng nhân tạo dịch thuật - NMT
    • Kỹ thuật sử dụng công cụ visualize chart, mô hình, mô phỏng 2D, 3D
  3. Đánh giá sau xử lý dữ liệu
    • Kỹ thuật quan sát tìm điểm bất thường
    • Đánh giá kết quả dữ liệu: độ tin cậy, dự báo, xác thực
  4. MỞ RỘNG (xem và học khóa DevBig19, DevBig21, DevBig21)
  • Lập kế hoạch bài toán xử lý dữ liệu
  • Kỹ thuật phân bổ công việc trong team
  • Phân tích từ thu thập dữ liệu lịch sử, thói quen, cảnh báo sớm qua chatbot
  • Mở rộng nhu cầu, tạo các bài toán dự báo, gợi ý, phân loại


Kỹ năng cho Data Analytics Engineer [edit]

Statistic Analyst

Data Analyst - Miner


  1. Sách tài liệu cho Kỹ sư phân tích dữ liệu (Data Analysis - Statistic Analyst - Data Analyst - Data Analytics Engineer), Vẽ biểu đồ chart 2D 3D, lập quan hệ điểm 2D (visualizer) : https://dathoc.net/bookda, dathoc.net/bookvis
  2. CƠ BẢN (xem và học khóa Bizda301 - Cơ bản phân tích dữ liệu dự đoán, ra quyết định cho doanh nghiệp)
    • Đọc hiểu yêu cầu khách hàng
    • Phân tích yêu cầu khách hàng ra yêu cầu xử lý dữ liệu (dữ liệu lớn, dữ liệu vừa) (xem Data Engineering)
    • Lập các chiến lược xử lý dữ liệu (xem Data Engineering
      • Tạo chu trình chung vào/ra xuyên suốt khi xử lý dữ liệu - data pipeline
      • Tham khảo kỹ thuật: cách thức thu thập dữ liệu
      • Tham khảo kỹ thuật: cách thức làm sạch, chuyển đổi dữ liệu
      • Tham khảo kỹ thuật: cách thức lưu trữ từng loại dữ liệu
      • Tham khảo kỹ thuật: các thuật toán đã có áp dụng dự đoán, phân loại dữ liệu
      • Tham khảo kỹ thuật: cách thức thể hiện view, visualize dữ liệu sau dự đoán, cho các đầu cuối (web, mobile)
    • Chuẩn bị kiến thức cập trình xử lý dữ liệu kèm công cụ: xem dathoc.net/bookda, folder huongdan_viet
      • Thống kê cơ bản Tiếng Việt: xem dathoc.net/bookda, folder huongdan_viet
      • Lập trình với Excel
      • Lập trình với Tableau
      • Lập trình với Power BI
    • Chuẩn bị máy móc, môi trường làm việc
    • Tiền xử lý dữ liệu (xem Data Engineering)
      • Làm sạch dữ liệu: text
      • Kỹ thuật truy vấn SQL
      • Kỹ thuật chuyển đổi qua SQL
    • Xử lý dữ liệu (xem Data Engineering)
      • Kỹ thuật chuyển đổi qua SQL
      • Kỹ thuật visualize dữ liệu, mô phỏng 2D, 3D
      • Phân tích mô tả
      • Phân tích dự đoán
      • Phân tích ra quyết định
  3. Đánh giá sau xử lý dữ liệu (xem Data Engineering)
    • Kỹ thuật quan sát tìm điểm bất thường
    • Đánh giá kết quả dữ liệu: độ tin cậy, dự báo, xác thực
  4. MỞ RỘNG (xem Kỹ thuật cho Data Engineer)




Kỹ năng cho Kỹ sư xây dựng nền tảng chuỗi khối - Blockchain Network Engineer
[edit]


1. CƠ BẢN (xem và học khóa Xây dựng ứng dụng BlockChain cơ bản - devbc18)

  • Đọc hiểu yêu cầu khách hàng
  • Phân tích yêu cầu khách hàng ra yêu cầu bài toán chuỗi khối
  • Lập các chiến lược xử lý + thiết kế + thực hiện
    • Tham khảo kỹ thuật: mô hình phát triển: waterfall, agile,..trong phát triển phần mềm (Google ra)
    • Kỹ thuật: tính toán và ra vào block (độ dài, dung lượng, lưu chuyển, thông tin phụ, mã hoá block, kết nối đầu cuối block với block khác, list giao dịch trong block, tìm kiếm block...), xem dathoc.net/bookbc, nciples, and Concurrent Programming
    • Kỹ thuật: tính toán ra vào một giao dịch (tạo giao dịch, mã hoá giao dịch, gộp giao dịch thành block, thực thi giao dịch, tính toán tổn thất tài nguyên, lưu vào block..), xem dathoc.net/bookbc, mastering bitcoin -chap3, hands on Hyperledger - chap Explore Hyperledger network
    • Kỹ thuật: tìm kiếm nhanh, tìm kiếm trên RAM, tìm kiếm theo index, tìm kiếm cây nhị phân theo mã đầu cuối block, xem dathoc.net/bookbc, art of computer program - chap 3
    • Kỹ thuật: hash để khó phá vỡ chuỗi mắt xích; kỹ thuật rsa để authen ra vào thực thi quyền, xem dathoc.net/bookbc, Applied Cryptography
    • Kỹ thuật: phân quyền user đóng hoặc mở với block: đồng thuận trên logic X, xem dathoc.net/bookbc, nciples, and Concurrent Programming
    • Kỹ thuật: i/o interface với json rpc 2.0, xem dathoc.net/bookbc, jsonrpc-en-latest
    • Kỹ thuật: Tạo logic mở và ngôn ngữ mở cho smartcontract, xem dathoc.net/bookbc, Smart Contracts
    • Kỹ thuật: tạo protocol giao tiếp 2 đầu cuối trong một network ip, xem dathoc.net/bookbc,  Patterns for Distributed Real-time Computation
    • Kỹ thuật: sync phân tán các dữ liệu sau mã hoá của một block sang các database phân tán khác, xem dathoc.net/bookbc,  Patterns for Distributed Real-time Computation
    • Kỹ thuật: tính toán tài nguyên sinh block, tạo ra cơ chế logic độ tốn tài nguyên với đơn vị tiền ảo mới, xem dathoc.net/bookbc, Clean C++ 
2. Mở rộng

  • Tối ưu hoá thuật toán đồng thuận nhiều bên
  • Tối ưu hoá tài nguyên tạo và sinh block

Kỹ năng cho Kỹ sư xây dựng ứng dụng chuỗi khối -  Blockchain Application Engineer [edit]


  1. CƠ BẢN (xem và học khóa Xây dựng ứng dụng BlockChain cơ bản - devbc18)
    • Đọc hiểu yêu cầu khách hàng
    • Phân tích yêu cầu khách hàng ra yêu cầu bài toán ứng dụng chuỗi khối
    • Lập các chiến lược: xem clip: https://www.youtube.com/watch? v=VrAjSjIN-5Q&list=PL0ANjPcxElLj6IBG_hP99O3U3jWv-B7at&index=2
    • Tham khao: https://hyperledger-fabric.readthedocs.io/en/release-2.2/
    • Tham khao: https://ethereum.org/en/developers/docs/
    • Tham khao: https://docs.corda.net/docs/corda-os/4.8/tutorials-index.html
    • Tham khảo kỹ thuật: mô hình phát triển: waterfall, agile,
      • Kỹ thuật: tạo ứng dụng phần mềm công nghệ thông tin nói chung (Google ra): phân rõ 3 lớp: logic client, logic backend, logic smartcontract
      • Kỹ thuật: lựa chọn mô hình chuỗi khối có sẵn hoặc tạo mới: Openchain, Multichain, H.Fabric, Bitcoin, Ethereum...
      • Kỹ thuật: áp dụng công nghệ bảo mật áp dụng: RSA, MD5, TLSv1.2
      • Kỹ thuật: lựa chọn thuật toán đồng thuận (có trên blockchain) phù hợp với tài nguyên bạn có
      • Kỹ thuật: lập trình với ngôn ngữ smartcontract mà mạng blockchain hỗ trợ; các logic cần xử lý trên mạng; logic cần xử lý phần backend; logic cần xử lý trên client
      • Kỹ thuật: phân tích công nghệ máy trạm phù hợp khi là html, js; UI trên ngôn ngữ client
      • Kỹ thuật: phân tích loại giao thức (protocol) phù hợp với từng kiểu giao dịch, ra vào mạng blockchain đã chọn
      • Kỹ thuật: các kỹ thuật cảnh báo tiến trình, xử lý tiến trình, cảnh báo tài nguyên trong quá trình xử lý; biết khi nào xử lý nào api nào đang lỗi; tài nguyên nào đang thiếu
      • Kỹ thuật: kỹ thuật replay khi có một giao dịch bị lỗi; bảo toàn giao dịch luôn phải được thực hiện khi từ client tới mạng blockchain
      • Kỹ thuật: kỹ thuật chuyển đổi request sang pubsub, queue; tránh bị rủi ro độ trễ, mất mát gọi api, dính vào api
  2. Chuẩn bị kiến thức cập trình xử lý dữ liệu
    • Lập trình cơ bản với ngôn ngữ phù hợp với team frontend, backend app, backend blockchain
    • Lập trình cơ bản với thư viện, database, framework sẵn có: Ethereum, Hyperledger Fabric, MS SQL, CouchDB, NodeJS, Go, .NET, Java...
  3. Chuẩn bị máy móc, môi trường làm việc
  4. Thiết kế bài toán
    • Tạo lược đồ UML
  5. Phát triển bài toán
    • Tạo môi trường CI
  6. Đánh giá kiểm định bài toán
    • Đánh giá kết quả kiểm tra, test trên mạng chuỗi khối
  7. MỞ RỘNG (xem và học khóa Devbc19, Devbc20)
    • Tạo mạng chuỗi khối riêng
    • Phân tích tối ưu tốc độ giao dịch
    • Thay đổi kiểu đồng thuận

Kỹ năng cho Machine Learning, Deep Learning Engineer, AI Engineer [edit]


  1. Sách tài liệu cho Kỹ sư tạo ứng dụng máy học, học sâu (ML, DL): https://dathoc.net/bookml
  2. CƠ BẢN (xem qua A ML short story)
    • Đọc hiểu yêu cầu khách hàng
    • Phân tích yêu cầu khách hàng ra yêu cầu dự đoán, máy học, học sâu (dữ liệu lớn, dữ liệu vừa)
    • Lập các chiến lược xử lý dữ liệu
      • Tạo chu trình chung vào/ra xuyên suốt khi xử lý dữ liệu - data pipeline
      • Tham khảo kỹ thuật: cách thức thu thập dữ liệu
      • Tham khảo kỹ thuật: cách thức làm sạch, chuyển đổi dữ liệu
      • Tham khảo kỹ thuật: cách thức lưu trữ từng loại dữ liệu
      • Tham khảo kỹ thuật: tạo các thuật toán mới, tối ưu thuật toán, áp dụng dự đoán, phân loại dữ liệu
      • Tham khảo kỹ thuật: các kỹ thuật cảnh báo tiến trình, xử lý tiến trình, cảnh báo tài nguyên trong quá trình xử lý
      • Tham khảo kỹ thuật: cách thức thể hiện view, visualize dữ liệu sau dự đoán, cho các đầu cuối (web, mobile)
      • Tham khảo kỹ thuật: các thuật toán học sâu cho một tiến trình mới xử lý
    • Chuẩn bị kiến thức cập trình xử lý dữ liệu
      • Lập trình cơ bản với ngôn ngữ python, java, scala
      • Lập trình cơ bản với thư viện, database: OpenCV, Tensorflow, Keras, RNN, CNN, NMT, LSTM, Spark, CouchBase, Parquet...
    • Chuẩn bị máy móc, môi trường làm việc
    • Tiền xử lý dữ liệu
      • Làm sạch dữ liệu: âm thanh, hình ảnh, video, text
    • Áp dụng thuật toán, hoặc tạo ra thuật toán
      • Kỹ thuật áp dụng thuật toán, đánh giá dữ liệu bất thường, check độ tin cậy
      • Kỹ thuật áp dụng thông số đầu vào, tạo ra thuật toán
    • Xử lý dữ liệu máy học
    • Xử lý dữ liệu học sâu
      • Artificial neural networks (CNN, LSTM, RNN, BiRNN, nmt...) & Deep neural networks (DNN, Nvidia cuDNN)
      • Kỹ thuật nhận diện giọng nói - Automatic speech recognition
      • Kỹ thuật nhận diện vật thể, mặt người qua ảnh - Image recognition
      • Kỹ thuật xử lý hình ảnh cao cấp, tạo mô phỏng theo mẫu - Visual art processing
      • Kỹ thuật xử lý ngôn ngữ tự nhiên - Natural language processing
      • Kỹ thuật phát hiện độc tích và quá trình thẩm thấu của biệt dược - Drug discovery and toxicology
      • Kỹ thuật phát hiện thói quen khách hàng - Customer relationship management
      • Kỹ thuật gơi ý theo dữ liệu lịch sử - Recommendation systems
      • Kỹ thuật xử lý sinh trắc học - Bioinformatics
      • Kỹ thuật chuẩn đoán bệnh qua scan xquang - Medical Image Analysis
      • Kỹ thuật tìm kiếm đối tượng quảng cáo - Mobile advertising
      • Kỹ thuật khôi phục ảnh - Image restoration
      • Kỹ thuật nhận diện giao dịch tài chính gian lận - Financial fraud detection
      • Kỹ thuật xử lý tầm bắn, tọa độ, độ bám mục tiêu trong quân đội
    • Đánh giá sau xử lý dữ liệu máy học
      • Đánh giá kết quả
    • Đánh giá sau xử lý dữ liệu học sâu
      • Đánh giá kết quả
      • Áp dụng điều chỉnh lại thuật toán
  3. MỞ RỘNG
    • Lập kế hoạch bài toán TỐI ƯU xử lý dữ liệu
    • TỐI ƯU thuật toán ml, dl
    • Mở rộng nhu cầu, tạo các ứng dụng đầu cuối cho các xử lý trên