Bài viết chuyên sâu

[Data Analytics, Data Engineering] How to study...

[Data Analytics, Data Engineering] How to study...

by Admin Dathoc -
Number of replies: 0

#dataengineering
#dataanalytics
#koolj_dataengineering
#howtostudy

Đọc xong một vài post chia sẻ của một số bạn trẻ ham muốn tìm hiểu và học thêm Nghề Phân tích dữ liệu, hay Gia công dữ liệu, tôi nhận thấy: đa phần các bạn có CÁC ĐIỂM YẾU sau trong quá trình KHAI PHÁ KIẾN THỨC tìm hiểu, tự học về NGHỀ, mà theo trải nghiệm cá nhân mình, tôi nghĩ tôi có thể HỖ TRỢ các bạn mới tìm hiểu theo các CÁCH KHAI PHÁ kiến thức như sau - tôi cho là hiệu quả và tốt nhất:
.
.
Và cũng như nhiều bài viết khác: dưới đây là trải nghiệm cá nhân. Nó có thể ĐÚNG hoặc SAI với bạn. Vậy bạn nhờ bổ sung thêm quan điểm để bài viết hữu ích nhất tới người đọc.
.
.
🎯1. Điểm yếu 1: Các bạn KHÔNG TÌM THẤY TRẬT TỰ của kiến thức.
Tức là:
- Các bạn thấy quá hỗn độn, choáng ngợp mặt mũi vì quá nhiều cái cần học
- Bạn thấy quá nhiều nơi chỉ giảng dạy kiến thức A, kiến thức B... xong đọc sang chỗ khác lại thấy họ chỉ dạy kiến thức C
- Bạn thấy có nơi bảo học kiến thức A trước, B sau; nơi khác lại bảo học B trước A sau
- Bạn thấy ở chỗ này kiến thức A chỉ dạy 2 ngày, chỉ có 3 trang sách; xong sang chỗ khác học phải cả tháng; và phải đọc 2-3 quyển sách mới hết

👉 --------------> Gợi ý CÁCH KHAI PHÁ kiến thức đúng để tìm TRẬT TỰ trong 5 phút
- Mỗi nơi trao kiến thức cho bạn: họ/tổ chức/khoá học/quyển sách.... sẽ luôn có những ĐỀ MỤC vắn tắt, mục lục, những đề cương vắn tắt; những giáo huấn gạch đầu dòng đơn giản nhất ...để tóm lược những khiến thức họ chuẩn bị giảng dạy cho bạn. Vậy nếu họ không có những cái này; hoặc KHÔNG THỂ NÓI RÕ cho bạn, vậy bạn có thể TÌM NƠI KHÁC để học kiến thức
- Đơn giản là các bạn (chưa cần xem, hiểu) chỉ cần mở ĐỀ MỤC của nơi cấp kiến thức; của quyển sách; của khoá học: rồi ghi lại cái khái niệm ra giấy, sổ tay, hoặc chụp ảnh điện thoại (có thể là từ ngữ tiếng Việt hoặc tiếng Anh, Pháp, Đức...), sau đó
- Mỗi ngày trong đời, bạn chỉ cần chọn 3 từ khoá và làm những bưới dưói đây:
- Bạn Google/Bing... bất kỳ cơ chế internet tìm kiếm, để tìm KHÁI NIỆM những từ khoá đó; và xem nó trả về bao nhiêu kết quả: hãy Google có định hướng, ví dụ KHÁI NIỆM kèm với từ khoá "definition", "syllabus" hoặc "how to" hoặc "steps"
- Bạn Google tìm kiếm các kiến thức khác CẦN CÓ trước khi học kiến thức đó: kèm từ khoá "prerequisites", "before studying"
- Bạn Google để tìm kiếm MỞ RỘNG, vẫn từ khái niệm, xong kết hợp tìm thêm các từ "practices", "advance", "best alter"
- Bạn Google để tìm kiếm TRẢI NGHIỆM THỰC TẾ, vẫn từ khái niệm, xong kết hợp tìm thêm các từ "demo", "case studies", "practices", "applied", "projects"
- BƯỚC CUỐI CÙNG: bạn sau khi thu thập khái niệm thông tin từ nơi khác, bạn hãy quay lại Tổ chức, Thầy cô... đang có Khoá học; tác giả Sách bạn đang đọc... chất vấn lại họ những khái niệm, thông tin bạn đã tìm hiểu: xem có ĐÚNG?, xem có THỪA THIẾU ở đâu không? - Ở đây muốn nhấn một điểm là: Không phải bạn thấy họ SAI, hay họ THIẾU mà bạn trách móc; mà ngược lại: bạn phải CẢM ƠN HỌ, vì chính họ đã tạo cho bạn cách khai phá; và từ khai phá bạn thấy được những ĐỦ và THIẾU từ tri thức bạn muốn tìm hiểu
.
.
🎯2. Điểm yếu 2: Các bạn CHƯA THẤY GIỎI sau khi học kiến thức, học khoá học của một thầy giáo cô giáo gọi là GIỎI, và thắc mắc làm thế nào để mình thụ đắc kiến thức tới mức GIỎI
Cụ thể bạn thấy:
- Ôi toàn kiến thức cơ bản
- Ôi toàn kiến thức KHÓ
- Ôi tôi học xong rồi: đủ 8 buổi và 20 giờ thực hành rồi: ...mà vẫn chưa GIỎI

👉 --------------> Gợi ý CÁCH KHAI PHÁ kiến thức đúng, để GIỎI kiến thức đó
- Theo bản thân trải nghiệm: tôi đã từng gặp những vấn đề về build docker, về tối ưu biến đổi spark, về lỗi khi tạo và chạy tính toán phân tán trong blockchain, xong bị lỗi và cũng tra cứu suốt nhiều tuần ...xong không thấy tìm kiếm 100k kết quả thì có 101k là các fans cũng có câu hỏi thắc mắc giống mình. Và chưa có kết quả giải pháp.
- Dù kiến thức đó là KHÓ hay CƠ BẢN, với phân tích và gia công dữ liệu nó vẫn phải có: dữ liệu kèm để thực hành; thuật toán logic để thực thi; hướng dẫn để hiểu từng công đoạn; ghi chép để nêu khái niệm ít nhiều về bước làm
- Dù kiến thức đó là KHÓ hay CƠ BẢN, bạn hãy thực hành nhiều; làm đi làm lại nhiều; luyện tập đi luyện lại nhiều... với phân tích và gia công dữ liệu: những gì cơ bản sẽ làm bạn chuyên nghiệp hơn; những gì khó sẽ dần dần làm bạn vỡ ra; hiểu rõ hơn - điều đó có thể 1-2 tháng bạn mới hiểu; 1-2 năm bạn mới hiểu; 20-30 năm bạn mới hiểu.
- Từ lớp 1 tới lớp 12, thầy cô giáo nào dạy tôi, họ đều đưa khái niệm: Các em phải LUYỆN TẬP, LUYỆN TẬP, LUYỆN TẬP, chỉ có làm luyện tập, thực hành nhiều mới giúp ta trở nên chuyên, thành thạo về cái đó.
- Và từ lớp 1 tới lớp 12, tôi cũng thấy: trong lớp 40 học sinh: sẽ có 1-2 bạn các bạn ý CHẲNG CẦN LUYỆN TẬP gì cả; xong họ vẫn giỏi; cô thầy hỏi gì họ bài hôm trước họ đều nói vanh vánh. Xong nếu để ý kỹ: 1-2 bạn đó các bạn ý nêu lại kiến thức ...theo Ý HIỂU của bạn ý. Không hoàn toàn 100% y hệt sách. Còn tôi toàn phải học thuộc lòng hoặc 100% làm đi làm lại tôi mới nhớ. Thực ra đó là thiên bẩm từng người. Và chính vì thầy cô giáo biết cơ địa, tố chất, thiên bẩm từng người vốn KHÔNG ĐỒNG ĐỀU nên thầy cô mới khuyên đại đa số học sinh: Các em phải LUYỆN TẬP, LUYỆN TẬP, LUYỆN TẬP. Vậy tôi định nghĩa: LUYỆN TẬP đó là con đường đi tới GIỎI và thậm chí THÀNH CÔNG.
- Theo dẫn chứng từ Việt Nam, nghề Phân tích dữ liệu Thống kê có từ rất lâu; phải nói là bắt đầu từ những ông/bà làm... Thầy Bói. Vậy bạn chỉ cần tìm hiểu Nghề Thầy Bói có từ khi nào sẽ hiểu nguồn cội. Xong chính xác được nở rộ RẦM RỘ nhất là từ 2016, khi manh nha có những Khoá học về Dữ liệu lớn - Bigdata của các Trường đại học tư. Cũng như sự nở rộ của 4G, 5G...hơn đâu hết đâu đâu cũng cần thu thập thông tin và phân tích nóng ở ngay Việt Nam. Vậy điều đó cũng có nghĩa: nhân tài về Phân tích dữ liệu; kèm gia công dữ liệu công tác và làm việc tại Việt Nam...thực sự HIẾM. Và độ dày thời gian chưa đủ nhiều để có thể gọi là: Nghệ tinh. Nước ngoài thì tôi không bàn.
- Khi ai đó, tổ chức đó, quyển sách đó.. cho bạn kiến thức về Nghề phân tích dữ liệu, gia công dữ liệu, và đang giảng dạy bạn - điều đó cũng có nghĩa: Họ đã thực hành phân tích dữ liệu, gia công dữ liệu, và thực thi trước đó từ kiến thức đó. Sau đó họ sẽ đúc kết các trải nghiệm để viết thành sách, viết thành khoá học phân tích dữ liệu, gia công dữ liệu. Thật HIẾM cho những tác giả, hoặc tổ chức họ TRUYỀN BÁ kiến thức xong...chưa thực hành phân tích dữ liệu, gia công dữ liệu; hoặc chỉ là kiến thức SUÔNG; chưa có đảm bảo kết quả phân tích dữ liệu, gia công dữ liệu.
- Trong cỡ vài chục năm gần đây: dựa trên nhu cầu nở rộ của tìm hiểu kiến thức và học tập: Một số tổ chức; chuyên gia; thầy giáo cô giáo; ..CHƯA MỘT LẦN phân tích dữ liệu, gia công dữ liệu... ; xong họ vẫn đi dạy phân tích dữ liệu, gia công dữ liệu. Điều đó thật NGUY HIỂM.
- Vậy SUY RA: đơn giản nhất: khi học THẦY/CÔ; học từ quyển sách ABC: bạn hãy đặt câu hỏi: thầy cô đã từng làm dự án nào về phân tích dữ liệu, gia công dữ liệu chưa? Và nghe xem họ trả lời thế nào! Rồi tự bạn phán quyết có tiếp tục tham gia Lớp học, Khoá học, hay mua và đọc sách đó không. Vì suy ra là: Chỉ có những thầy/cô, sách ấn bản lại nhiều lần: mới là Nghệ tinh. Và bạn nên theo những cá nhân, sách đó để tu tập.
- Một điểm nhất khác: Các khoá học, quyển sách, bài viết, bài chia sẻ... Bạn hãy nghĩ đơn giản đó là KIẾN THỨC và TRẢI NGHIỆM, nó hoàn toàn không phải là phép màu để bạn GIỎI. Bạn chỉ GIỎI khi áp dụng, thực hành thành thạo từ nó. Và để thành thạo không có gì khác là LUYỆN TẬP.

.
.
🎯3. Điểm yếu 3: Các bạn CHƯA THẤY kiến thức PHÙ HỢP với bài toán thực tế; mặc dù đã học, sau đó đã đi làm thực tế
- Bạn không dám tham gia học Khoá học; chưa muốn trả tiền mua sách về học; vì bạn CHƯA TÌM RA vậy kiến thức đó có áp dụng nghề mình đang cần không
- Bạn tiêu tốn quá nhiều chi phí tiền bạc để học kiến thức..; NHƯNG sau đó đi làm kiến thức trong công việc hoàn toàn mới; và phủ nhận những cái bạn đã học
- Bạn mất nhiều thời gian, công sức tìm kiếm kiến thức; học xong nó; và master nó; NHƯNG sau đó bạn đi làm và thực tế không như bạn nghĩ.

👉 --------------> Gợi ý CÁCH KHAI PHÁ kiến thức đúng, để PHÙ HỢP với bài toán thực tế
- Đa phần các fans mới vào Nghề phân tích gia công dữ liệu: bị đi ngược. Tức là bạn thấy ai đó bảo Khoá học A tốt là bạn cũng vào học. Bạn thấy bố mẹ bạn bắt bạn đăng ký nghề đó; khoá học đó; tổ chức đó... là bạn đồng ý theo. Rất bị động. Rất không trực quan.
- Theo tôi: cần cho những bạn CHƯA BIẾT GÌ, não đang sạch, đi làm thực tập NGAY VÀ LUÔN các công ty đi, các cty bất kỳ có doanh số mua bán; các công ty tổ chức về buôn bán thì càng tốt; logistic, bán buôn càng tốt nữa. Tôi nghĩ chỉ cần 2-3 tuần các bạn ở đó thôi, là các bạn sẽ hiểu, sẽ biết mình cần học...chuyên môn gì, ngoại ngữ gì để bổ sung.
- Đầu tiên, theo cá nhân trải nghiệm, bạn hãy quan sát và tìm hiểu NGHỀ đó trước khi tham gia thử việc, học việc, fresher; hãy đừng là con tốt hay bù nhìn để kiểu như: thôi các anh giao việc gì em làm nấy; hay là: thôi họ vào intern data, mình cũng vào thôi. Mà hãy làm: đi thực tế tìm hiểu những công việc của nghề đó; tìm hiểu những ng 40-50 tuổi làm với nghề đó; không có trong nước thì tìm hiểu ngoài nước. Không có trên internet vậy tìm tên tuổi công ty; rồi đi tới quan sát; ghi chép; phỏng vấn trực tiếp anh chị.
- Tiếp: Bạn đọc bài viết A, bài báo B về Nghề đó; vậy đơn giản bạn đi xem quan sát xem nó có đúng như bạn nghĩ không? chưa cần tham gia làm đâu. Bạn hãy nội suy những logic kiểu như:
+ Làm thế nào để người ta, tổ chức quản trị được 1 triệu đơn hàng 1 ngày
+ Làm thế nào để người ta, tổ chức quản trị được 1 triệu shipping 1 ngày
+ Làm thế nào để người ta, tổ chức biết được ngày +1 tới sẽ nhập hàng gì cho phù hợp
+ Làm thế nào để người ta, tổ chức quản trị được: phần vận hành nào bị lỗi; lỗi thì họ xử lý thế nào
+ Làm thế nào để người ta đánh giá nhanh nhất khi có vấn đề: người ta áp dụng cái gì đó realtime và tự động; hay là ng ta chờ đợi kết quả phân tích từ một đội ngũ
- Tiếp tới: tra cứu sách báo CHUYÊN NGHÀNH về các vấn đề bạn đang nội suy. Có thể dathoc.net/bookda là một kho sách free cho bạn.
- Tiếp tới: sau các bước trên bạn sẽ có loạt vấn đề và giải pháp trên lý thuyết sách vở có nêu. Mặc dù bạn đọc và thời gian tìm hiểu hơn ngắn, có thể mất 1-2 tuần; bạn chưa hiểu gì đâu. Xong bạn sẽ có một loạt gạch đầu dòng thông tin, để bạn hỏi chính những Khoá học, bạn đang muốn áp dụng là: có giải quyết các vấn đề trên không.
- Cuối cùng, bạn cần kết hợp: những cái Khoá học, quyển sách chưa nói... về vấn đề thực tại bạn đang áp dụng phân tích ; sau đó tổng hợp để bạn có một DANH SÁCH KIẾN THỨC mà bạn phác thảo cần học. Sau đó mới tìm khoá học phù hợp với danh sách đó. Có thể là cover 80%, 90% list kiến thức.
.
.
🎯4. Điểm yếu 4: Các bạn CHƯA TÌM THẤY phổ tri thức hoặc phổ nghề chuỗi các kiến thức khác liên đới tới KIẾN THỨC CHÍNH đó
Tức là:
- Kiến thức A trong nghề nào? có bao nhiêu nghề từ kiến thức A? tôi phải học bao giờ mới hết chuỗi ngành nghề, sau đó tôi chọn 1 nghề tôi thích
- Ở đây nói kiến thức A, kiến thức B, xong ..nó có phục vụ Nghề mình làm trong trh nào, và độ bao phủ bao nhiêu
- Ở đây chưa nói kiến thức A thuộc CHUỖI nghề nào; và nó phục vụ cho bao nhiêu Nghề

👉 --------------> Gợi ý CÁCH KHAI PHÁ kiến thức đúng, để TÌM THẤY phổ tri thức hoặc phổ nghề
- Có nhiều bạn luôn đặt câu hỏi cho mình, cũng như nhiều tổ chức khác về Đào tạo: em bây giờ học Khoá này vậy cần học thêm những khoá nào khác để bổ sung kiến thức? để có được kiến thức xuyên suốt Nghề. Đơn giản bạn có thể tìm hiểu ngay từ... các chuyên ngành của các Trường Đại học, mình đã nêu trong dathoc.net/skill. Từ đại học trong nước tới ngoài nước: người ta ghi rất rõ các Kỹ năng gì, môn học gì cần học để bạn làm tốt Phân tích và gia công dữ liệu. Hay nói cách khác việc tạo ra những chuyên ngành và tối ưu riêng ở Nhà trường, đã phần nào cho bạn thấy Phổ kiến thức cần học, kèm phổ nghề.... dù bạn chưa tham gia vào học hay chưa là sinh viên trường/tổ chức đó
- Tất nhiên điều đó cũng chưa hẳn những cái Nhà trường dạy là đã bao phủ hết Phổ nghề hay Phổ kiến thức Phân tích và gia công dữ liệu. Xong đó là những từ ngữ chuyên nghành dành riêng cho nghề. Nhiệm vụ của bạn là đào bới rộng ra; kỹ thuật công nghệ hiện tại đã update theo kiến thức đó thế nào? một kiến thức có bao nhiêu kỹ thuật áp dụng?; các kỹ thuật từ các giai đoạn nó tiến hoá giúp cải tiến ra sao? Cái mà Nhà trường rất ít cập nhật; rất ít mở rộng.
- Và cũng phải công nhận rằng: kiến thức, kỹ thuật hôm nay bạn học; có thể ngay ngày mai nó là lỗi thời. Vậy đơn giản là update thôi. Học thêm thôi. Điều đó cũng có nghĩa: bạn sẽ nắm sâu hơn; giỏi hơn
- Trải nghiệm của mình là: Nghề phân tích dữ liệu, gia công dữ liệu: rất đa dạng và muôn vẻ muôn màu: mỗi nhánh nghề có nhiều tri thức bên trong; mỗi nhánh nghề có những tu tập, trải nghiệm nhiều tháng năm thực tế bạn mới hiểu, bạn mới ngấm; bạn mới biết
- Trải nghiệm là: nó như một kiểu hacking hệ thống: đúng như thế. Vì thực ra không có chuẩn nào chung cho việc đi sâu một nhánh nghề; đặc biệt trong Phân tích và gia công dữ liệu; đơn giản là nó có nhiều cách làm; có nhiều cách tối ưu
- Một vài ví dụ cách mình khai phá phổ nghề, phổ kiến thức:
+ Để tìm một hướng dẫn đơn giản PHỔ NGHỀ bất kỳ, bạn tra cứu khái niệm qua internet tìm kiếm, vd Google kèm từ khoá "roadmap"
+ Khi đọc sách về LÀM SẠCH DỮ LIỆU (data cleanse - bạn có thể tìm trong dathoc.net/bookda), vậy sách đó đã nêu TOÀN BỘ KHÂU khác nhau về phan tích dữ liệu; và nó đi sâu vào RIÊNG một khâu làm sạch, biến đổi, tinh gọn. Theo đó cần tìm thêm những sách khác bài viết khác về datacleanse. Tìm trên kaggle.com những phần thực hành về cleanse
+ Khi đọc sách về CƠ SỞ DỮ LIỆU CHO PHÂN TÍCH 15 NGHIỆP VỤ (data warehouse toolkits - bạn có thể tìm trong dathoc.net/bookda), vậy sách đó đã nêu TOÀN BỘ KHÂU khác nhau về phân tích dữ liệu; và nó đi sâu vào RIÊNG một khâu làm tinh gọn dữ liệu RIÊNG CHO NGHIỆP VỤ 1- nghiệp vụ 2- nghiệp vụ 3

.
.
🎯5. Điểm yếu 5: Các bạn CHƯA TÌM THẤY DỮ LIỆU, TÀI NGUYÊN, NGUYÊN LIỆU, CÔNG CỤ để phục vụ triển khai, thực tập, hoặc phục vụ cho thực hành kiến thức đó
Tức là:
- Vậy thư viện, mô hình sẵn có của nhiều Nhà phát triển mở... ở đâu, tôi muốn dùng thử từ kiến thức A này
- Vậy dữ liệu tài nguyên đâu cho tôi thử kiến thức B
- Tôi tìm rồi, không có; và khó với tới dữ liệu đó lắm

👉 --------------> Gợi ý CÁCH KHAI PHÁ kiến thức đúng, để TÌM THẤY DỮ LIỆU, NGUYÊN LIỆU, CÔNG CỤ phục vụ thực hành, triển khai
- Về DỮ LIỆU THÔ: Tôi nồng nhiệt gợi ý bạn vào KHO và link từ tôi tập hợp: dathoc.net/kho, đó cũng là nơi mình trải nghiệm nhiều moại loại data mà tôi muốn làm mô hình dự báo gì đó; từ những bảng biểu mẫu phân tích kinh doanh tài chính excel, mẫu rủi ro, 6 sigma, tới...dữ liệu thô text, âm thanh, hình ảnh khuôn mặt, xquang....Một số loại dữ liệu thô khác chuyên môn: bắt buộc phải bảo mật theo phạm vi tổ chức Quốc gia: hoặc tổ chức chuyên biệt: khiến bạn phải là chuyên gia của tổ chức, của phòng ban thuộc Quốc gia Nhà nước mới có; mới khai thác thực hành áp dụng bài toán được.
- Về TÀI NGUYÊN CÔNG CỤ, TOOLS: bạn lưu ý là mỗi một công nghệ bạn đang thực thi sẽ có loạt những tools, mẫu support, hay mô hình có sẵn để phục vụ bạn: ví dụ:
+ Bạn phân tích rủi ro: có loạt mẫu rủi ro excel trên, toàn các vị 50 năm tuổi nghề đã về hưu share lại cho con cháu
+ Bạn muốn visualize vậy: đơn giản nhất là python lib matplotlib, excel, rồi powerbi, tableau... Xong tụi tôi lại ưa chuộng vega, canvas.js, mapd, vì cơ động hơn. Tôi nghĩ nếu không có những tool này thì...tụi tôi phải code hàng tháng mới ra.
+ Bạn muốn áp dụng thuật toán vậy: dùng python scikit-learn, spark mllib, yolo lib, tensor rt lib, tensorflow lib
+ Bạn muốn áp dụng mô hình build sẵn: chịu khó tìm git và Google tên mô hình, hoặc tiên logic bạn làm kèm từ khoá "prebuilt" "pre-trained" "presets" "model"
- Khi ai đó, tổ chức đó, quyển sách đó.. cho bạn kiến thức về Nghề phân tích dữ liệu, gia công dữ liệu, và đang giảng dạy bạn - điều đó cũng có nghĩa: Họ đã thực hành phân tích dữ liệu, gia công dữ liệu, và thực thi trước đó từ kiến thức đó. Sau đó họ sẽ đúc kết các trải nghiệm để viết thành sách, viết thành khoá học phân tích dữ liệu, gia công dữ liệu. Điều đó cũng có nghĩa: họ phải kèm theo những DỮ LIỆU ít nhiều trong sách đó; trong Khoá học đó; trong trải nghiệm Bài viết đó
- Nếu họ không kèm theo, điều đó có nghĩa: lý thuyết đó là rất SUÔNG; họ chưa chứng minh được; họ chưa thực hành đủ chuyên sâu; đủ từ thực tiễn tới lý thuyết họ nêu. Vậy bạn chỉ nên tham khảo kiến thức đó
.
.
Hy vọng bài viết từ trải nghiệm cá nhân sẽ mang lại hiệu quả học tập Nghề Phân tích dữ liệu, Gia công dữ liệu cho bạn.
Bạn có thể bổ sung thêm để bài viết tốt hơn.
Gluk!
Mình: dathoc.net/cv