- Một thiết bị trí tuệ nhân tạo (AI) mới có thể giúp những người bị rối loạn giọng nói (bao gồm cả những người mắc bệnh lý về dây thanh quản hoặc đang hồi phục sau phẫu thuật ung thư thanh quản) có thể nói chuyện dễ dàng hơn.
Các kỹ sư sinh học tại UCLA đã phát minh ra một thiết bị nhỏ gọn, linh hoạt gắn vào cổ và chuyển các chuyển động cơ của thanh quản thành giọng nói có thể nghe được. Ảnh: Jun Chen Lab/UCLA |
Nhóm kỹ sư của Đại học California tại Los Angeles, Mỹ (UCLA) vừa phát minh ra một thiết bị nhỏ gọn được hỗ trợ bởi trí tuệ nhân tạo, có thể gắn vào vùng cổ nhằm giúp những người bị rối loạn chức năng dây thanh quản lấy lại giọng nói. Kết quả nghiên cứu này đã được công bố trên tạp chí Nature Communications.
Thiết bị này được huấn luyện thông qua trí tuệ nhân tạo học máy để nhận biết chuyển động cơ thanh quản nào tương ứng với từ ngữ nào và chuyển những tín hiệu đó thành giọng nói có thể nghe được. Công nghệ tự cấp nguồn có thể đóng vai trò như một công cụ không xâm lấn cho những người mất khả năng nói do vấn đề về dây thanh quản.
Với kích thước mỗi cạnh 1,2 inch, nặng khoảng 7 gram và chỉ dày 0,06 inch, thiết bị nhỏ gọn này được tạo thành từ 2 thành phần. Một là cảm biến tự cấp nguồn, phát hiện và chuyển đổi tín hiệu được tạo ra bởi chuyển động của cơ thành tín hiệu điện có độ chính xác cao, có thể phân tích được. Những tín hiệu điện sinh học này sau đó được dịch thành tín hiệu giọng nói bằng thuật toán trí tuệ nhân tạo học máy. Hai là thành phần truyền động, biến các tín hiệu giọng nói đó thành biểu thức giọng nói mong muốn.
Thiết bị này có khả năng phát hiện những thay đổi trong từ trường khi nó bị thay đổi do lực cơ học - trong trường hợp này là chuyển động của cơ thanh quản. Các cuộn dây cảm ứng được "nhúng" trong các lớp đàn hồi từ tính giúp tạo ra các tín hiệu điện có độ chính xác cao cho mục đích cảm biến.
Các nhà nghiên cứu đã thử nghiệm công nghệ thiết bị đeo trên những người trưởng thành khỏe mạnh. Họ thu thập dữ liệu về chuyển động của cơ thanh quản và sử dụng thuật toán trí tuệ nhân tạo học máy để so sánh các tín hiệu thu được với một số từ nhất định. Sau đó, họ chọn tín hiệu giọng nói đầu ra tương ứng thông qua thành phần truyền động của thiết bị.
Độ chính xác dự đoán tổng thể của mô hình là 94,68%, với tín hiệu giọng nói của người tham gia được khuếch đại bởi thành phần truyền động, chứng tỏ rằng cơ chế cảm biến đã nhận ra tín hiệu chuyển động thanh quản của họ và khớp với câu tương ứng mà người tham gia muốn nói.
Nhóm tác giả cho biết, rối loạn giọng nói phổ biến ở mọi lứa tuổi và nhóm nhân khẩu học. Nghiên cứu đã chỉ ra rằng gần 30% số người sẽ trải qua ít nhất một chứng rối loạn như vậy trong đời. Tuy nhiên, với các phương pháp trị liệu, chẳng hạn như can thiệp bằng phẫu thuật và trị liệu bằng giọng nói, quá trình phục hồi giọng nói có thể kéo dài từ 3 tháng đến 1 năm, với một số kỹ thuật xâm lấn đòi hỏi phải có một khoảng thời gian đáng kể để nghỉ ngơi sau phẫu thuật.
Trưởng nhóm tác giả Jun Chen tại UCLA cho biết: "Thiết bị mới này mang đến một lựa chọn không xâm lấn, có khả năng hỗ trợ bệnh nhân giao tiếp trong giai đoạn trước khi điều trị và trong giai đoạn phục hồi sau điều trị đối với chứng rối loạn giọng nói".
Trong tương lai, nhóm nghiên cứu có kế hoạch tiếp tục mở rộng vốn từ vựng của thiết bị thông qua trí tuệ nhân tạo học máy và thử nghiệm nó ở những người bị rối loạn ngôn ngữ.