TensorFlow và PyTorch xuất hiện trong phần AI nền tảng vì đây là hai framework quan trọng để người học tiếp cận machine learning theo hướng thực hành. Việc đưa chúng vào sớm giúp người học hiểu mối liên hệ giữa lý thuyết AI, mô hình học máy và cách triển khai bài toán bằng công cụ phổ biến trong ngành.
Tokenization, stemming và embedding được đặt trong phần NLP vì workflow xử lý ngôn ngữ tự nhiên thường đi từ tiền xử lý văn bản đến biểu diễn từ/câu, rồi mới áp dụng cho các bài toán như chatbot hoặc sentiment analysis. Cách sắp xếp này phù hợp với người mới vì giúp đi từ dữ liệu text thô đến bài toán ứng dụng cụ thể.
Spark, Hadoop và Kafka thuộc nhóm Data Engineering vì chúng gắn trực tiếp với data pipeline, xử lý dữ liệu lớn và luồng dữ liệu trong hệ thống thực tế. Bộ công cụ này phù hợp cho người muốn hiểu cách dữ liệu được thu thập, xử lý và vận hành ở quy mô lớn trước khi đưa vào phân tích hoặc mô hình AI.
Leetcode 200 được đưa riêng thành một mảng luyện thuật toán vì tư duy giải thuật là phần thường gặp trong phỏng vấn kỹ thuật, đặc biệt với AI/ML Engineer và các vị trí liên quan đến lập trình. Cách này giúp người học không chỉ học công cụ mà còn rèn khả năng giải quyết bài toán bằng cấu trúc dữ liệu và thuật toán.