Các nhà nghiên cứu phát triển hệ thống cải tiến nhận diện giọng nói

 

Các sinh viên sau đại học và các nhà nghiên cứu tại Đại học Texas ở  Dallas đã phát triển các hệ thống mới có thể nhận diện giọng nói cho dù ở  điều kiện khó có thể thu được giọng nói, chẳng hạn như nói thì thầm , nói với những cảm xúc khác nhau , hoặc nói chuyện khi bị nghẹt mũi.

Với việc nâng cao khả năng này để phát hiện giọng nói ở các điều kiện khác nhau, nghiên cứu này có thể được sử dụng trong các ứng dụng nhận dạng giọng nói như đăng nhập vào một ngân hàng, mở khóa phòng, đăng nhập vào một máy tính, hoặc xác minh mua hàng trực tuyến.

Các nhà nghiên cứu đang làm việc tại Trung tâm Robust Speech Systems (CRSs) dưới sự chỉ đạo của Tiến sĩ John Hansen, phó trưởng khoa nghiên cứu trong các trường Kỹ thuật và Khoa học Máy tính Erik Jonsson.

Sử dụng các thuật toán và kỹ thuật đồ hình, giải pháp của nhóm đang được quan tâm  bởi các nhà nghiên cứu khác trong lĩnh vực xử lý tín hiệu. Nhóm nghiên cứu đã được ghi nhận trong các cuộc thi quốc tế được tài trợ bởi chính phủ liên bang, cũng như các tổ chức kỹ thuật chuyên nghiệp lớn nhất thế giới – Viện Kỹ sư Điện và Điện tử (IEEE).

Mùa thu năm ngoái, phòng thí nghiệm CRSs đã đạt được thứ hạng cao trong  Viện Tiêu chuẩn và Công nghệ giọng nói. Đầu mùa hè này, nhóm nghiên cứu đã giành được giải thưởng về đề tài tốt nhất đưa ra tại Hội nghị quốc tế IEEE quốc tế lần thứ 38 về Âm, lời nói và xử lý tín hiệu.

Xác minh người nói bằng cách hoặc chấp nhận hay từ chối một tín hiệu âm thanh phù hợp với giọng nói của một người. Quá trình này có thể bị nhiễu  bởi tiếng ồn xung quanh hay các loại micro được sử dụng. Giọng nói của người nói cũng có thể thay đổi nếu người nghe những tiếng ồn xung quanh , bị bệnh hoặc có tuổi.

Thông thường, hệ thống xác minh người nói được phát triển trong điều kiện lý tưởng – khi tiếng ồn xung quanh được kiểm soát, khi người được chuẩn bị để ghi hoặc đọc một văn bản chuẩn bị sẵn sàng.

Trong  lần thử  nghiệm gần đây  của Viện Tiêu chuẩn và Đánh Giá Công nghệ Giọng Nói, các nhân viên đã gửi khoảng 80 triệu thử nghiệm xác nhận giọng nói có lẫn tiếng ồn – âm thanh nền tự nhiên hoặc âm thanh máy tính tạo ra – từ hơn 50 trường đại học , phòng thí nghiệm nghiên cứu và các công ty trên toàn thế giới . Nhóm làm việc phải xác định xem các bản ghi âm bài phát biểu là của con người hay là không phải.

Thành viên phòng thí nghiệm CRSs  ở  UT Dallas đã được cải tiến quy trình này dựa trên nghiên cứu trước đây và tham gia vào các cuộc thi tương tự. Họ đã tạo ra thuật toán hiệu quả hơn chuyển đổi âm thanh dạng sóng vào xử lý máy tính để phân tích mẫu . Quá trình của họ cũng loại bỏ sự im lặng và tiếng ồn xung quanh để cho phép các máy tính để dành nhiều nguồn tài nguyên  hơn vào tiếng nói âm phát ra để tìm ra những đặc điểm của người nói .

Thành viên trong nhóm đã thực hiện mô hình kết hợp tất cả các thuật toán . Họ tiếp tục kỹ thuật của mình với đầu vào trực tuyến thường xuyên từ các nhóm  khác ở Hà Lan , Singapore, Phần Lan , Úc , Anh , Pháp và Thụy Sĩ .

Đầu mùa hè này, đề tài viết về hệ thống của họ đã giành được một giải thưởng đề tài  trong Hội nghị quốc tế IEEE – hội nghị hàng đầu trong lĩnh vực xử lý tín hiệu với sự tham dự của hơn 2.000 người . IBM là một nhà tài trợ của giải thưởng , và các đề tài chiến thắng đã nhận được  500$. Ngoài Hasan và Sadjadi , các học sinh khác góp phần trong đó Gang Liu và Navid Shokouhi , nghiên cứu sinh trong ngành kỹ thuật điện. Hynek Boril , phó giáo sư nghiên cứu trong ngành  kỹ thuật điện , cũng là đồng tác giả chính của nghiên cứu và cộng tác viên trong cuộc thi.

 

Để lại Comment

Your email address will not be published. Required fields are marked *

FREE DOWNLOADS!
Chúng tôi hiện có nhiều Ebook (cả tiếng Anh lẫn tiếng Việt) liên quan đến các lãnh vực điều khiển chiếu sáng, HVAC, Security, BMS, Tiết Kiệm Năng Lượng...cũng như các Tools, Software, Reports...Tất cả đều có thể DOWNLOAD MIỄN PHÍ. Bạn có muốn xem qua?
Free Ebook
NEW EBOOK
Nhiều E-book mới, hay, hữu ích và miễn phí download chúng tôi vừa mới chia sẻ trong kho Resource. Bạn có muốn xem qua?