Giám sát sức khỏe từ xa qua camera điện thoại: Công nghệ rPPG và pipeline xử lý dữ liệu sinh học

Nguyên lý thu nhận tín hiệu sinh học từ video thông thường (rPPG)
Remote photoplethysmography (rPPG) là phương pháp trích xuất thay đổi thể tích máu mao mạch thông qua biến thiên cường độ ánh sáng phản xạ trên da. Khi tim co bóp, lượng máu tăng lên làm thay đổi độ hấp thụ và phản xạ ánh sáng ở bước sóng khả kiến, chủ yếu trong dải màu xanh lá và đỏ. Camera điện thoại ghi lại chuỗi khung hình 30 fps; thuật toán xác định vùng quan tâm (ROI detection) trên vùng da mặt, thường là trán và má, để lấy trung bình giá trị pixel theo thời gian.
Tín hiệu thô thu được chứa cả nhịp tim, nhịp thở và nhiễu từ ánh sáng môi trường. Phương pháp phân tách nguồn độc lập (ICA) hoặc lọc thông dải 0,7–4 Hz được áp dụng để cô lập thành phần tuần hoàn. Tỷ lệ tín hiệu trên nhiễu (signal-to-noise ratio) quyết định khả năng phân biệt nhịp tim thực với dao động ánh sáng. Trong điều kiện ánh sáng ban ngày tại đồng bằng sông Cửu Long, SNR thường thấp hơn so với môi trường phòng khám do ánh sáng tán xạ và bóng đổ thay đổi nhanh.
Pipeline xử lý dữ liệu và mô hình học sâu
Dữ liệu video thô trải qua chuỗi tiền xử lý gồm căn chỉnh khuôn mặt theo khung (face alignment), loại bỏ khung hình bị mờ do chuyển động, và chuẩn hóa histogram để giảm ảnh hưởng của ánh sáng nhiệt đới. Sau đó, mô hình học sâu kết hợp Convolutional Neural Network (CNN) và Transformer được sử dụng để ước lượng đồng thời nhịp tim, nhịp thở và SpO2.

CNN trích xuất đặc trưng không gian từ từng khung hình, trong khi Transformer mô hình hóa mối quan hệ thời gian dài giữa các khung để bù đắp cho tín hiệu bị đứt quãng do nháy mắt hoặc cử động đầu. Để giảm nhiễu chuyển động, kỹ thuật motion compensation dựa trên optical flow được chèn trước lớp CNN. Đối với SpO2, mô hình khai thác tỷ lệ hấp thụ giữa hai kênh màu (red và blue) thay vì chỉ dựa vào một kênh duy nhất như phương pháp rPPG cổ điển.
Toàn bộ pipeline có thể chạy trên edge computing tại thiết bị di động hoặc trạm y tế xã để hạn chế truyền dữ liệu thô về server trung tâm. Việc này giảm băng thông nhưng đòi hỏi tối ưu hóa mô hình để phù hợp với bộ xử lý di động thông dụng tại Việt Nam.
Cơ chế bảo mật và giảm thiểu rủi ro rò rỉ dữ liệu sinh trắc
Dữ liệu sinh trắc thu được từ rPPG thuộc loại dữ liệu nhạy cảm theo quy định về bảo vệ dữ liệu cá nhân. Trong tình huống giả định áp dụng tại hạ tầng Việt Nam, hai kỹ thuật được xem xét là federated learning và mã hóa homomorphic.
Federated learning cho phép huấn luyện mô hình tại nhiều trạm y tế xã mà không cần chuyển dữ liệu thô về một điểm tập trung; chỉ các tham số mô hình được tổng hợp. Mã hóa homomorphic cho phép thực hiện phép tính trực tiếp trên dữ liệu đã mã hóa, giúp server xử lý mà không giải mã được nội dung sinh trắc. Kết hợp hai phương pháp này giảm diện tích tiếp xúc của dữ liệu nhạy cảm trong quá trình truyền và lưu trữ.
Tuy nhiên, hiệu quả thực tế còn phụ thuộc vào khả năng triển khai hạ tầng khóa công khai và chính sách quản lý khóa tại các đơn vị y tế địa phương. Mọi thông số về tốc độ truyền và chi phí tính toán trong tình huống này đều mang tính giả định và cần được kiểm chứng độc lập trước khi mở rộng.
Các chỉ số kỹ thuật then chốt cho tích hợp hệ thống
Để dữ liệu rPPG có thể đưa vào hồ sơ sức khỏe điện tử quốc gia, cần đạt đồng thời ba nhóm chỉ số chính. Độ chính xác được đo bằng root mean square error (RMSE): RMSE nhịp tim dưới 5 nhịp/phút, RMSE nhịp thở dưới 2 nhịp/phút và RMSE SpO2 dưới 3 % là mức thường được đặt ra trong các nghiên cứu tiền triển khai. Độ trễ inference (inference latency) trên thiết bị di động cần dưới 800 ms để đảm bảo trải nghiệm người dùng liên tục. Yêu cầu băng thông trung bình cho mỗi phiên giám sát 60 giây dao động trong khoảng 120–200 kbps khi chỉ gửi đặc trưng đã nén thay vì video gốc.
Các chỉ số trên phải được đo lặp lại trong điều kiện ánh sáng và chuyển động thực tế của khu vực nông thôn trước khi hệ thống được kết nối với nền tảng dữ liệu y tế quốc gia. Việc kiểm chứng độc lập bởi đơn vị không tham gia phát triển là điều kiện bắt buộc để xác định liệu các ngưỡng này có duy trì ổn định sau khi mở rộng quy mô hay không.
Tóm lại, việc đưa rPPG vào giám sát sức khỏe từ xa đòi hỏi kiểm soát đồng thời chất lượng tín hiệu quang học, hiệu suất mô hình học sâu trên thiết bị biên, và cơ chế bảo vệ dữ liệu phân tán. Mọi con số kỹ thuật và kịch bản triển khai được nêu trong bài đều thuộc tình huống giả định và cần được xác minh thực tế trước khi áp dụng rộng rãi tại Việt Nam.
