Để xây dựng một mô hình AI từ đầu đòi hỏi nguồn lực khổng lồ: thời gian dài, chi phí cao và đội ngũ chuyên gia. Nhưng AWS đã giới thiệu một dịch vụ có tên là Amazon Nova Forge sẽ giúp thay đổi điều này. Đây là một trong những dịch vụ đầu tiên trên thế giới cho phép doanh nghiệp xây dựng mô hình frontier (mô hình AI tiên tiến, quy mô lớn) tùy chỉnh, gọi là “Novella” dựa trên nền tảng Amazon Nova, với chi phí hợp lý và quy trình đơn giản hơn rất nhiều.

Vì sao doanh nghiệp cần mô hình AI tùy chỉnh?
Trí tuệ nhân tạo (AI) đang trở thành lợi thế cạnh tranh quan trọng của doanh nghiệp. Tuy nhiên, giá trị thực sự của AI không chỉ nằm ở việc sử dụng các mô hình có sẵn, mà ở khả năng xây dựng mô hình AI hiểu rõ dữ liệu, nghiệp vụ và quy trình riêng của doanh nghiệp.
Các mô hình ngôn ngữ lớn (LLM) hiện nay có khả năng xử lý đa dạng tác vụ, nhưng chúng thường thiếu hiểu biết sâu về dữ liệu chuyên ngành hoặc quy trình nội bộ. Vì vậy, nhiều doanh nghiệp bắt đầu tìm cách tùy chỉnh mô hình AI để đáp ứng nhu cầu thực tế.
Quy trình huấn luyện AI truyền thống
Huấn luyện AI là quá trình để mô hình “học hỏi” từ dữ liệu lớn, tự nhận diện mẫu hình và đưa ra dự đoán mà không cần lập trình quy tắc thủ công. Hiệu suất của mô hình phụ thuộc chủ yếu vào ba yếu tố chính: dữ liệu đầu vào cần chất lượng cao, kiến trúc mô hình cùng thuật toán tối ưu hóa cách học, và quy trình huấn luyện lặp lại liên tục – mô hình dự đoán, tính toán sai số rồi điều chỉnh trọng số giảm dần lỗi theo thời gian.
Ví dụ đơn giản: Một mô hình phát hiện email spam được huấn luyện từ hàng triệu email đã được gắn nhãn. Ban đầu nó dự đoán chưa chính xác, nhiều false positive, nhưng qua nhiều vòng lặp, dần nhận ra đặc điểm của thư rác và cải thiện độ chính xác theo thời gian.
Các bước cơ bản để huấn luyện AI thường bao gồm:
- Xác định rõ bài toán cần giải quyết
- Chuẩn bị dữ liệu: : Giai đoạn này bao gồm thu thập, gán nhãn (labeling), làm sạch và tiền xử lý dữ liệu
- Chọn mô hình và chuẩn bị hạ tầng tính toán
- Huấn luyện mô hình: Dữ liệu được đưa qua mô hình nhiều lần (epochs), mỗi lần mô hình dự đoán, đo lường sai số (loss), rồi tự động điều chỉnh để dự đoán chính xác hơn
- Đánh giá, tinh chỉnh và triển khai vào thực tế

Các bước trong quy trình huấn luyện AI
Amazon Nova Forge – Đơn giản hóa việc xây dựng mô hình AI tùy chỉnh
Nova Forge cho phép bạn bắt đầu từ checkpoint sớm (early checkpoints) của Amazon Nova, tức là các điểm dừng giữa các giai đoạn huấn luyện: từ pre-training (học kiến thức cơ bản) đến post-training (tinh chỉnh hành vi). Nhờ đó, doanh nghiệp không cần phải xây dựng mô hình frontier từ con số 0 mà tận dụng được kiến thức nền tảng đã rất mạnh của Nova. Từ đó rút ngắn thời gian triển khai và tối ưu hóa chi phí so với phương pháp truyền thống

Các bước cốt lõi của Nova Forge
Dưới đây là cách Nova Forge hiện đại hóa quy trình:
1. Xác định mục tiêu và lựa chọn điểm khởi đầu phù hợp. Bước đầu tiên là xác định rõ ràng vai trò của AI trong doanh nghiệp, chẳng hạn như hỗ trợ chăm sóc khách hàng, phân tích dữ liệu chuyên ngành, hoặc tự động hóa quy trình nội bộ. Nova Forge cung cấp các checkpoint từ dòng mô hình Nova (bao gồm cả Nova 2 Lite cho tác vụ nhanh và tiết kiệm chi phí, Nova 2 Pro cho suy luận phức tạp, và Nova 2 Omni cho xử lý đa phương thức). Việc chọn checkpoint phù hợp giúp cân bằng giữa hiệu suất và chi phí, đồng thời tận dụng được trí tuệ tổng quát sẵn có của Nova.
2. Tùy chỉnh mô hình với dữ liệu riêng mà vẫn duy trì khả năng tổng quát. Một thách thức phổ biến khi fine-tune mô hình với dữ liệu riêng là hiện tượng catastrophic forgetting – đây là tình trạng mô hình có nguy cơ mất đi kiến thức nền tảng đã học trước đó. Nova Forge giảm thiểu đáng kể vấn đề này bằng cách kết hợp dữ liệu riêng với dữ liệu được đã được chọn lọc và kiểm soát chất lượng cao từ Amazon Nova ở mọi giai đoạn huấn luyện. Quy trình tùy chỉnh linh hoạt qua các phương pháp sau:
- Continued Pre-Training: Tích hợp dữ liệu lớn ở giai đoạn đầu để mở rộng kiến thức cơ bản.
- Mid-training: Bổ sung kiến thức chuyên biệt ở giai đoạn giữa, với learning rate phù hợp để duy trì tính tổng quát.
- Supervised Fine-Tuning: Sử dụng dữ liệu có nhãn để cải thiện độ chính xác và định hướng phản hồi.
- Reinforcement Learning: Tinh chỉnh hành vi dựa trên phản hồi thực tế từ môi trường (qua API và reward functions). Kết quả là mô hình giữ vững khả năng suy luận tổng quát, đồng thời tích hợp sâu kiến thức chuyên ngành – hiệu quả ngay cả khi lượng dữ liệu riêng hạn chế.
3. Huấn luyện trên hạ tầng được quản lý toàn diện. Nova Forge hoạt động hoàn toàn trên Amazon SageMaker AI (kết hợp với SageMaker HyperPod), loại bỏ nhu cầu quản lý server, scaling hoặc cấu hình phức tạp. AWS cung cấp các recipes (công thức huấn luyện sẵn) để kết hợp dữ liệu một cách dễ dàng thông qua giao diện trực quan, CLI hoặc Jupyter Notebook trong SageMaker Studio.
4. Tích hợp Responsible AI ngay từ đầu. Dịch vụ tích hợp toolkit Responsible AI sẵn có, hỗ trợ thiết lập guardrails (rào chắn an toàn) để kiểm soát nội dung, giảm thiểu rủi ro thông tin không phù hợp, đồng thời đảm bảo tuân thủ chính sách nội bộ và quy định pháp lý.
5. Triển khai và tích hợp vào hệ thống. Sau khi hoàn tất huấn luyện, mô hình tùy chỉnh được lưu trữ an toàn trên AWS và dễ dàng đưa vào Amazon Bedrock dưới dạng private model. Bạn có thể gọi mô hình qua API thống nhất, tích hợp trực tiếp vào ứng dụng hiện có mà không cần quản lý hạ tầng inference riêng biệt – giúp tăng cường bảo mật, khả năng mở rộng và nhất quán với hệ sinh thái AWS.
Quy trình này mang lại lợi thế cạnh tranh rõ rệt cho doanh nghiệp: xây dựng mô hình chuyên biệt hóa cao mà vẫn tận dụng được sức mạnh frontier của Nova, với chi phí và độ phức tạp thấp hơn đáng kể so với huấn luyện từ đầu.
Tóm lại
Amazon Nova Forge không thay thế hoàn toàn quyết định chiến lược hay sáng tạo của doanh nghiệp, nhưng nó giúp đơn giản hóa đáng kể phần kỹ thuật phức tạp trong việc xây dựng mô hình AI tùy chỉnh. Nhờ checkpoint sớm, trộn dữ liệu thông minh và hạ tầng quản lý, doanh nghiệp có thể nhanh chóng sở hữu AI “chính chủ” phù hợp hơn với nhu cầu thực tế.
Do là dịch vụ mới nên hiện tại Amazon Nova Forge chỉ đang có ở region US East (N. Virginia), yêu cầu đăng ký subscription hàng năm. Nếu bạn đang tìm cách đưa AI sâu hơn vào hoạt động kinh doanh, Nova Forge là một lựa chọn đáng cân nhắc để rút ngắn hành trình từ ý tưởng đến triển khai và áp dụng trong doanh nghiệp.
Theo dõi True IDC trên Fanpage để cập nhật các thông tin mới nhất: True IDC Vietnam Fanpage
