Báo Cáo Kỹ Thuật: Triển Khai Trí Tuệ Phân Tán Tại Biên Cho Hệ Thống Giám Sát Nhà Máy

BÁO CÁO ĐIỀU TRA KỸ THUẬT HIỆN TRƯỜNG
Nhà máy điện tử Bình Dương – Hệ thống giám sát tự động
Người lập: Kỹ sư điều tra độc lập
Ngày khảo sát: 12/03/2025
Lưu ý: Toàn bộ nội dung dưới đây là tình huống giả định, được xây dựng chỉ nhằm mục đích phân tích kỹ thuật. Không phản ánh sự kiện thực tế nào.
Hiện trường vụ việc
Hệ thống trí tuệ nhân tạo tập trung hiện tại tại phân xưởng SMT đang gặp tắc nghẽn băng thông tải lên liên tục ở mức 180–220 Mbps và độ trễ đầu cuối trung bình 840 ms (p95 = 1,4 s). Camera công nghiệp gửi khung hình thô 1080p@15fps về đám mây, gây quá tải router biên và làm chậm phản hồi điều khiển robot. Tình huống này được mô phỏng để đánh giá khả năng chuyển dịch sang trí tuệ phân tán nhúng biên.
Mảnh ghép bằng chứng 1 – Kiến trúc mô hình nén và lượng tử hóa trên MCU/ESP32
Mô hình phân loại lỗi linh kiện ban đầu (ResNet-18) có kích thước 44,6 MB, tiêu tốn 1,8 GFLOPs. Sau khi áp dụng huấn luyện nhận thức lượng tử hóa với trọng số 4-bit và kích hoạt 8-bit kết hợp cắt tỉa 65%, kích thước giảm xuống còn 287 KB, FLOPs còn 48 MFLOPs. Trên ESP32-S3 (240 MHz, phần mở rộng vector) thời gian suy luận đạt 23 ms mỗi lần suy luận, tiêu hao 4,7 mJ. Độ chính xác top-1 giảm từ 94,2% xuống 89,7% trên tập xác thực nội bộ. Kết quả cho thấy việc chạy mô hình tại biên là khả thi về mặt tài nguyên, nhưng mức giảm chính xác 4,5% cần được chấp nhận hoặc bù bằng phương pháp tổng hợp nhẹ.

Mảnh ghép bằng chứng 2 – Cơ chế đồng thuận nhẹ giữa các nút biên
Thay vì gửi gradient về đám mây, 24 nút ESP32-S3 được tổ chức theo giao thức lan truyền tin đồn với trung bình hóa liên kết cục bộ. Mỗi vòng lan truyền kéo dài 180 ms, mỗi nút chỉ trao đổi delta đã lượng tử hóa 4-bit (kích thước 12–18 KB) với 3 nút láng giềng ngẫu nhiên. Sau 7 vòng, mô hình hội tụ với chênh lệch trọng số trung bình dưới 0,8% so với học liên kết tập trung. Không cần kết nối đám mây trong quá trình này, giảm băng thông tải lên xuống dưới 8 Mbps. Tuy nhiên, khi cấu trúc mạng thay đổi mạnh (mất 30% nút), thời gian hội tụ tăng lên 14 vòng và độ chính xác giảm thêm 1,9%.
Mảnh ghép bằng chứng 3 – Xử lý dữ liệu cảm biến thời gian thực với SRAM hạn chế
Mỗi nút thu thập dữ liệu từ 6 cảm biến (nhiệt độ, rung, dòng điện) ở tần số 200 Hz. SRAM khả dụng chỉ 512 KB. Giải pháp áp dụng cửa sổ trượt 256 mẫu kết hợp điểm kiểm tra mỗi 40 ms vào PSRAM 8 MB. Mức sử dụng bộ nhớ đỉnh ổn định ở 187 KB, cho phép đường ống song song giữa thu thập và suy luận. Độ trễ từ đầu đến cuối từ khi lấy mẫu đến quyết định tại biên là 41 ms. Nhược điểm rõ rệt là điểm kiểm tra làm tăng tiêu hao năng lượng thêm 1,8 mJ mỗi chu kỳ và rủi ro mất dữ liệu khi nguồn bị ngắt đột ngột.
Mảnh ghép bằng chứng 4 – Cơ chế bảo mật nhẹ chống tấn công đầu độc mô hình
Triển khai bộ phát hiện bất thường TinyML (MLP 2 lớp 4-bit, 19 KB) kết hợp phần tử bảo mật ATECC608 để ký số gradient trước khi lan truyền tin đồn. Bộ phát hiện phát hiện 87% mẫu đầu độc cơ bản (lật nhãn) với tỷ lệ dương tính giả 4,2% và thêm 6,3 ms độ trễ. Phần tử bảo mật đảm bảo tính toàn vẹn với chi phí 0,9 mJ mỗi chữ ký. Tuy nhiên, khi kẻ tấn công kiểm soát từ 4 nút liền kề trở lên, khả năng phát hiện giảm xuống 61%; đây là hạn chế cấu trúc của cơ chế phòng thủ chỉ dựa vào dữ liệu cục bộ.
Kết luận điều tra
Tại Việt Nam, giải pháp trí tuệ phân tán nhúng biên phù hợp với các nhà máy vừa và nhỏ có kết nối mạng không ổn định hoặc chi phí đám mây cao. Các con số thực nghiệm cho thấy có thể giảm băng thông 95% và độ trễ xuống dưới 50 ms, đồng thời chấp nhận đánh đổi độ chính xác 4–6% và tăng tiêu hao năng lượng cục bộ. Tuy nhiên, rủi ro đầu độc khi số nút bị kiểm soát tăng, cũng như chi phí bảo trì firmware phân tán trên hàng trăm thiết bị, vẫn chưa có giải pháp hoàn chỉnh. Do đó, đám mây không phải là giải pháp duy nhất, nhưng việc thay thế hoàn toàn cần đánh giá kỹ chi phí năng lượng và cơ chế bảo mật trong môi trường sản xuất thực tế. Độc giả nên tự kiểm chứng các thông số trên phần cứng cụ thể trước khi áp dụng.
