NumPy và Pandas là lớp công cụ đầu tiên trong workflow dữ liệu vì chúng dùng để làm việc với dữ liệu dạng bảng, xử lý mảng số và chuẩn bị dữ liệu trước khi đưa vào mô hình. Với người mới học AI, đây là bước nền cần có trước khi chạm vào thuật toán.
Matplotlib và Seaborn được đưa vào ngay sau phần dữ liệu để người học quan sát phân phối, xu hướng và mối quan hệ giữa các biến. Trong thực tế, trực quan hóa giúp hiểu dữ liệu nhanh hơn và hỗ trợ việc đọc kết quả trước khi xây dựng model.
scikit-learn phù hợp cho giai đoạn nhập môn Machine Learning vì cung cấp các thuật toán cơ bản để học phân loại, dự đoán và phân cụm theo cách có hệ thống. Đây là bước chuyển hợp lý từ xử lý dữ liệu sang xây dựng mô hình.
TensorFlow và Keras được đưa vào ở phần AI để người học làm quen với framework xây dựng mô hình sâu hơn, sau khi đã có nền Python và hiểu logic dữ liệu. Cách sắp xếp này hợp với người mới vì đi từ thao tác dữ liệu sang mô hình hóa thay vì nhảy thẳng vào AI framework.