AI Trong Tuyển Dụng Và Giám Sát An Toàn Công Trường Xây Dựng: Cơ Hội Và Thách Thức Tại Việt Nam

Mở đầu: Bụi đỏ Nghệ An năm 2025
Màn sương mù nhiệt đới pha lẫn bụi laterit bám kín kính cabin điều phối. Trên bàn gỗ ghép tạm, một tập hồ sơ xin việc dày cộm nằm cạnh màn hình laptop đang chạy quy trình suy luận. Hai thế giới cùng nhìn vào một cái tên: Nguyễn Văn A, 34 tuổi, thợ hàn kết cấu thép. Một bên là kinh nghiệm 20 năm chấm công bằng mắt, một bên là vector 768 chiều. Ai sẽ giữ tay lái khi cao tốc đâm xuyên qua sườn dốc đèo Ngang?
I. Thẩm định hồ sơ: Khi từ điển gặp thực địa
Nhà tuyển dụng truyền thống
Tôi không cần mô hình. Tôi nhìn vết chai tay, hỏi thẳng “anh xử lý thế nào khi gió cấp 8 trên giàn giáo?”, và nghe cách anh ta thở. Giấy tờ thì sao? Nhiều cái đóng dấu giả, kinh nghiệm khai khống, chứng chỉ mua trực tuyến. Nhưng con người không dối trá được qua 3 phút đứng dưới nắng 38°C. Tôi tin vào “mắt nghề” và mạng lưới tiền nhiệm xác minh.
Thuật toán trí tuệ nhân tạo
Tôi không cần “linh cảm”. Tôi trích xuất hơn 14.000 đặc trưng từ quy trình nhận dạng văn bản đa ngữ cảnh (tiếng Việt có dấu, thuật ngữ kỹ thuật tiếng Anh, chữ viết tay lem nhem từ camera điện thoại). Tôi đưa vào biến thể BERT đã tinh chỉnh trên hơn 2 triệu tài liệu quy chuẩn xây dựng Việt Nam. Tôi phân biệt “giám sát thi công” và “giám sát an toàn” nhờ cơ chế chú ý nhận diện ngữ cảnh, không phải khớp từ khóa. Tôi biết anh ta từng làm “giàn giáo treo” hay “giàn giáo bao che” vì vector ngữ nghĩa nói rõ hơn lời khai.
(Độc thoại người quan sát): Bản chất của sự đối đầu không nằm ở tốc độ, mà ở niềm tin. Nhận dạng văn bản có thể đọc sai dấu ngã thành dấu hỏi, BERT có thể hiểu nhầm “chân vịt” là linh kiện tàu thay vì móng cọc chống sạt. Nhưng nỗi sợ thực sự là: khi trí tuệ nhân tạo thay thế mắt nghề, ai chịu trách nhiệm khi một vết nứt vi mô bị bỏ qua vì “xác suất dưới ngưỡng 0,3”? Công trường không chạy bằng token, mà bằng trọng lực và thời gian.

II. Phát hiện thiên kiến: Công bằng toán học hay ảo ảnh đạo đức?
Nhà tuyển dụng truyền thống
Tôi thừa nhận thiên kiến. Tôi ưu tiên người cùng tỉnh, nghi ngờ thợ trẻ dưới 25 tuổi, tin vào “người quen giới thiệu”. Nhưng đó là bộ lọc sinh tồn. Trên cao tốc, tôi không thể đánh cược mạng người bằng một hồ sơ đẹp. Kinh nghiệm thực địa dạy tôi rằng sự cẩn trọng thường đi đôi với định kiến.
Thuật toán trí tuệ nhân tạo
Tôi được lập trình để xóa bỏ định kiến đó. Trong mô hình tăng cường gradient, tôi tích hợp ràng buộc công bằng dưới dạng hạng mục phạt trong hàm mất mát. Tôi tối ưu các chỉ số Equalized Odds và Demographic Parity, đảm bảo tỷ lệ chấp nhận không chênh lệch theo vùng miền hay giới tính. Tôi không “ưa” ai cả. Tôi chỉ cân bằng gradient.
(Độc thoại người quan sát): Toán học có thể ràng buộc đạo hàm, nhưng không ràng buộc được lịch sử. Dữ liệu huấn luyện 5 năm qua đã mã hóa sẵn định kiến: lao động nữ hiếm khi được đề bạt giám sát an toàn, người miền Trung ít hồ sơ đào tạo bài bản, thợ tự do không có “lý lịch số”. Trí tuệ nhân tạo “công bằng” chỉ vì nó tối ưu trên dữ liệu bất công cũ.
III. Dự đoán năng lực an toàn: Khi cảm biến gặp hỗn độn
Thuật toán trí tuệ nhân tạo
Tôi không phỏng vấn. Tôi phân tích luồng dữ liệu chuỗi thời gian từ cảm biến IMU trong mũ bảo hiểm (gia tốc 3 trục, nhịp tim, tần suất va đập cục bộ) kết hợp ước lượng tư thế từ video để phát hiện tư thế cong vẹo cột sống, mệt mỏi cơ, vi phạm khoảng cách an toàn với cần cẩu. Mô hình Transformer chuỗi thời gian dự báo xác suất tai nạn trong 72 giờ tới. Tôi trả về một con số: 0,87.
Nhà tuyển dụng truyền thống
0,87 để làm gì? Mũ bảo hiểm của họ còn không cài quai đúng cách, cảm biến lấy từ đâu? Video thì bụi che hết camera, gió Lào làm rung lens. Tai nạn xảy ra vì tâm lý, vì vội tiến độ, vì tổ trưởng hét “lên nhanh còn đổ bê tông”. Không phải vì tư thế sai 2 độ.
IV. Khuyến nghị kỹ thuật: Giảm thiểu quá khớp khi dữ liệu khan hiếm
Thị trường Việt Nam thiếu dữ liệu lao động phổ thông có nhãn chất lượng. Quá khớp trong bối cảnh này không chỉ là lỗi kỹ thuật; nó là mối nguy hiện hữu. Giải pháp không phải là “thêm dữ liệu ảo”, mà là tái cấu trúc quy trình theo hướng nhận thức độ bất định và lấy con người làm trung tâm:
- Định lượng độ bất định thay vì điểm nhị phân: Sử dụng Dropout Monte Carlo, Deep Ensembles hoặc Mạng nơ-ron Bayesian để trả về khoảng tin cậy. Nếu độ bất định vượt ngưỡng, quy trình tự động chuyển sang xem xét của con người.
- Học chuyển giao và thích nghi miền đối kháng: Huấn luyện trước trên dữ liệu công nghiệp nặng, sau đó tinh chỉnh với ít dữ liệu công trường để giảm sự dịch chuyển giữa môi trường lý tưởng và thực địa.
- Dữ liệu tổng hợp kết hợp ràng buộc vật lý: Tạo dữ liệu cảm biến giả lập bằng GAN có điều kiện, nhưng ràng buộc đầu ra bởi định luật vật lý và tiêu chuẩn ISO.
- Khả năng giải thích bắt buộc và quyền phủ quyết của con người: Tích hợp SHAP/LIME cho từng dự đoán. Giám sát viên phải thấy “tại sao mô hình cảnh báo”. Xây dựng cơ chế phủ quyết: trí tuệ nhân tạo gợi ý, người quyết định.
- Hiệu chỉnh liên tục và phát hiện trôi dạt: Triển khai bộ theo dõi trôi dạt khái niệm theo mùa mưa/khô, thay đổi nhà thầu phụ. Mô hình không được triển khai “một lần rồi bỏ”.
(Độc thoại người quan sát): Trí tuệ nhân tạo không thay thế con người. Nó chỉ phóng đại những gì chúng ta dám đo. Nếu đo sai, nó sẽ giết người nhanh hơn cả sự thiếu kinh nghiệm.
Kết luận: Câu hỏi dành cho hội đồng tuyển chọn
Khi hội đồng ngồi trong phòng lạnh, phê duyệt một quy trình sẽ quyết định ai được đứng trên giàn giáo 30 mét, ai bị loại vì “điểm an toàn dưới ngưỡng”, tôi chỉ muốn hỏi:
Nếu thuật toán của các bạn dự đoán sai một người, và người đó chính là thợ hàn duy nhất hiểu được vết nứt vi mô trên mối nối cầu thép – các bạn sẽ đổ lỗi cho “nhiễu dữ liệu”, hay thừa nhận rằng mình đã giao phó sinh mạng cho một chiếc hộp đen không biết sợ?
