Cơ bản về đọc khẩu hình: kỳ vọng thực tế và luyện tập | UCSF EARS
Sống tốt

Cơ bản về đọc khẩu hình: kỳ vọng thực tế, luyện tập và đào tạo

“Đọc khẩu hình” thực ra là đọc lời nói bằng mắt: sử dụng toàn bộ khuôn mặt, ngôn ngữ cơ thể và ngữ cảnh, cùng với bất kỳ âm thanh nào bạn nghe được, để hiểu lời nói. Hướng dẫn này giải thích điều gì là thực tế, vì sao việc này có thể khiến bạn kiệt sức, và cách để cải thiện.

Được biên tập bởi chuyên gia lâm sàng Tìm hiểu thêm Đọc trong 12 phút Cập nhật tháng 2 năm 2026

Bạn sẽ nhận được gì từ trang này

  • Đọc lời nói bằng mắt có thể và không thể làm gì (và vì sao “đọc khẩu hình hoàn hảo” không phải là mục tiêu thực tế).
  • Vì sao việc này gây mệt (và cách giảm bớt công sức).
  • Một kế hoạch luyện tập thực tế mà bạn có thể làm tại nhà.
  • Khi nào việc đào tạo là đáng giá và những cải thiện thường trông như thế nào.

Điều hướng nhanh: Cơ bản về đọc lời nói bằng mắt · Kỳ vọng thực tế · Vì sao khó · Môi trường là quan trọng nhất · Kế hoạch luyện tập · Đào tạo · Rào cản (khẩu trang, râu, v.v.) · Câu hỏi thường gặp

Trước tiên: “Đọc khẩu hình” và “đọc lời nói bằng mắt”

Hầu hết mọi người nói “đọc khẩu hình”, nhưng kỹ năng thực sự giúp ích trong đời sống hàng ngày là đọc lời nói bằng mắt: sử dụng chuyển động của môi toàn bộ khuôn mặt, cử chỉ và ngữ cảnh, thường đồng thời tận dụng bất kỳ âm thanh nào bạn còn nghe được.7

Thông tin thị giác của lời nói là có thật và có thể đo lường, nhưng nó cũng không đầy đủ và đôi khi mơ hồ, vì nhiều âm thanh trông giống nhau (và có những âm gần như không nhìn thấy được).1

Mục tiêu = “bắt được đủ thông tin để theo kịp cuộc trò chuyện”, chứ không phải “hiểu từng từ chỉ bằng mắt”.

Đọc lời nói bằng mắt (chỉ dùng thị giác) chính xác đến mức nào?

Đây là phần thường khiến mọi người cảm thấy nhẹ nhõm hơn, hoặc hơi thấy như vũ trụ đang chơi khăm mình: đọc lời nói bằng mắt mà không có âm thanh thực sự có giới hạn, và mức độ khác nhau rất nhiều giữa từng người.12

Các nghiên cứu cho thấy gì (mốc tham khảo điển hình)

  • Trong một nghiên cứu lớn ở người lớn có thính lực bình thường, mức trung bình khi đọc lời nói bằng mắt ở mức câu là khoảng ~21% số từ đúng (với khác biệt cá nhân rất lớn).1
  • Trong một nghiên cứu so sánh các nhóm, người lớn bị mất thính lực nặng đến sâu từ sớm đạt trung bình khoảng ~44% số từ đúng trong một bài tập câu chỉ dùng thị giác, trong khi người lớn có thính lực bình thường đạt khoảng ~19%, và một lần nữa mức độ khác biệt giữa cá nhân rất lớn.2

Nói ngắn gọn: có người bẩm sinh đọc lời nói bằng mắt rất tốt; nhiều người thì không; và không ai đạt 100% chỉ nhờ thị giác trong đời sống thực. Đó là lý do vì sao ngữ cảnh và âm thanh, dù chỉ là một phần, lại quan trọng đến vậy.7

Một cách nhìn lại hữu ích

Nếu bạn có thể “theo được chủ đề”, bắt được tên hoặc từ khóa, và biết khi nào nên nhờ lặp lại, thì đó là thành công. Đó là chức năng thực tế.

Vì sao đọc lời nói bằng mắt khó (và đó không phải lỗi của bạn)

1) Nhiều âm thanh trông giống nhau

Nhiều âm nói có cùng hình dạng miệng khi nhìn bằng mắt. Ví dụ, /p/, /b/ và /m/ có thể trông rất giống nhau. Các nhà khoa học ngôn ngữ thường xếp những âm “trông giống nhau” này vào các nhóm thị giác (thường gọi là viseme). Đó là một lý do khiến độ chính xác khi chỉ dựa vào thị giác có giới hạn.7

2) Một số âm gần như không nhìn thấy

Những âm được tạo ra sâu hơn trong miệng (như /k/ và /g/) có ít tín hiệu nhìn thấy hơn. Điều đó có nghĩa là não bạn phải dựa nhiều hơn vào ngữ cảnh và sự dự đoán, ngay cả khi bạn đang nhìn rất chăm chú.7

3) Não bạn đang giải một câu đố tốc độ cao

Đọc lời nói bằng mắt không chỉ là “nhìn môi”. Đó là quá trình kết hợp nhanh giữa âm thanh không đầy đủ, tín hiệu từ khuôn mặt và ý nghĩa, cộng thêm việc dự đoán liên tục. Khi tín hiệu bị suy giảm (tiếng ồn, khoảng cách, giọng địa phương, nhiều người nói), não phải bỏ ra nhiều công sức hơn để theo kịp.5

Vì sao việc này có thể khiến bạn kiệt sức

Nếu đọc lời nói bằng mắt khiến bạn mệt, đó không phải là do bạn yếu, mà là do nó đòi hỏi nỗ lực. Nỗ lực là phản ứng bình thường khi não phải làm việc với dữ liệu đầu vào không đầy đủ. Các mô hình về “nghe đòi hỏi nhiều công sức” mô tả cách thông tin cảm giác bị giới hạn làm tăng gánh nặng nhận thức và sự mệt mỏi theo thời gian.6

Vì sao máy trợ thính (hoặc cấy ghép) vẫn quan trọng nếu bạn đọc lời nói bằng mắt

Tín hiệu thị giác và âm thanh phối hợp với nhau. Nghiên cứu kinh điển cho thấy việc thêm thông tin thị giác của lời nói có thể cải thiện đáng kể khả năng hiểu trong môi trường ồn, so với chỉ nghe một mình, nhất là khi tín hiệu thính giác yếu.3 Các hiệu ứng nghe - nhìn (như “hiệu ứng McGurk” nổi tiếng) nhắc chúng ta rằng não được tạo ra để kết hợp những gì nó nghe và những gì nó thấy.4

Kết luận thực tế: ngay cả khi công nghệ trợ thính không làm lời nói trở nên “hoàn hảo”, âm thanh một phần vẫn có thể giúp làm rõ những cử động miệng trông giống nhau, để bạn đỡ phải đoán hơn.

Muốn việc này trở nên dễ hơn và bớt tốn sức hơn?

Đọc lời nói bằng mắt hiệu quả nhất khi đi kèm với cách chuẩn bị giao tiếp tốt và những công cụ phù hợp (hỗ trợ thính giác, phụ đề và các chiến lược “sửa lỗi” trong hội thoại).

Cải thiện nhanh hơn: bắt đầu từ môi trường

Đọc lời nói bằng mắt cải thiện nhiều nhất khi bạn làm cho tín hiệu thị giác trở nên rõ ràng và dễ đoán hơn. Hãy nghĩ đơn giản là: “Cho mắt tôi một cơ hội công bằng.”

Ánh sáng

Ánh sáng nên chiếu vào mặt người nói, không phải từ phía sau họ. Ngược sáng sẽ tạo thành bóng đen = không còn manh mối hữu ích từ khẩu hình.

Khoảng cách và góc nhìn

Thường thì gần hơn sẽ tốt hơn, nhưng vẫn nên tự nhiên. Nhìn trực diện thường tốt hơn nhìn nghiêng khi cần chi tiết hình ảnh.

Mỗi lần chỉ một người nói

Nói luân phiên giúp mắt bạn tập trung vào một khuôn mặt. Nói chồng chéo trong nhóm là chế độ “siêu khó” của đọc lời nói bằng mắt.

Nêu chủ đề trước

Ngữ cảnh là nguồn trợ lực rất mạnh. Hãy hỏi: “Chúng ta đang nói về chuyện gì?” trước khi đi vào chi tiết.

Câu gợi ý chuẩn bị nhanh

“Chúng ta có thể ngồi ở chỗ để tôi nhìn rõ mặt bạn hơn được không?”

“Bạn có thể nói chủ đề trước được không? Như vậy tôi sẽ dễ theo phần chi tiết hơn.”

“Nếu mỗi lần chỉ một người nói thì tôi sẽ dễ theo hơn.”

Một kế hoạch luyện tập đơn giản (10 phút mỗi ngày)

Việc luyện tập hiệu quả nhất khi có cấu trúc, ngắn gọn và có thể lặp lại, để bạn nhận ra tiến bộ mà không bị kiệt sức. Nghiên cứu và các bài tổng quan về đào tạo đọc khẩu hình hoặc đọc lời nói bằng mắt nhấn mạnh giá trị của phản hồi, người nói giống tình huống thực và lịch luyện tập mà mọi người thực sự duy trì được.7

  1. Chọn một chương trình quen thuộc (ban đầu cùng một người nói sẽ giúp giảm bớt sự khác biệt).
  2. Xem 2 phút với phụ đề để nắm chủ đề và từ vựng.11
  3. Xem lại đúng 2 phút đó mà không bật phụ đề, tập trung vào toàn bộ khuôn mặt (không chỉ môi).
  4. Bật lại phụ đề và kiểm tra xem bạn bỏ lỡ điều gì (đừng ngại, đây chỉ là dữ liệu phản hồi).
  5. Lặp lại cùng một đoạn đó 2 đến 3 lần trong tuần (luyện tập ngắt quãng hiệu quả hơn nhồi nhét một lần).

Cách “nâng cấp” sau 1 đến 2 tuần

  • Tăng độ đa dạng từ từ: thêm một người nói thứ hai (giọng hoặc khuôn mặt khác) khi bạn đã thấy quy trình hiện tại khá dễ.
  • Luyện các câu “sửa lỗi” trong hội thoại: mục tiêu không phải là không bỏ lỡ gì cả, mà là phục hồi nhanh khi bị hụt thông tin.
  • Làm cho giống thực tế hơn: thử một đoạn ngắn có tiếng ồn nền nhẹ sau khi bạn đã làm tốt bản yên tĩnh.

Một thay đổi giúp ích ngay lập tức

Thay vì nói “Gì cơ?”, hãy thử: “Tôi nghe được phần đầu rồi, bạn có thể nói lại câu cuối không?” Yêu cầu lặp lại một cách cụ thể giúp giảm đoán mò và giữ cho cuộc trò chuyện trôi chảy.

Việc đào tạo có giúp không?

Đào tạo có thể giúp, nhưng mức cải thiện thường khác nhau, và thường hữu ích nhất khi việc đào tạo làm cho quá trình luyện tập trở nên đều đặn và “gần với đời thực” (có phản hồi, nhiều người nói, và các bài tập giống với việc nghe hiểu hằng ngày). Các bài tổng quan trong thính học nhấn mạnh cả tầm quan trọng tiếp diễn của đọc khẩu hình trong việc nhận biết lời nói trong môi trường ồn lẫn thách thức trong việc giúp kết quả luyện tập áp dụng được rộng rãi sang nhiều người nói và bối cảnh khác nhau.7 Những nghiên cứu mới hơn cũng tìm hiểu cơ chế học tập nền tảng và mốc thời gian học hỏi, điều này hữu ích để thiết kế việc luyện tập thực sự có tác dụng lâu dài.8

Việc đào tạo đáng làm nhất khi…

  • Bạn phụ thuộc nhiều vào tín hiệu thị giác và muốn có một lộ trình luyện tập có cấu trúc.
  • Bạn gặp khó khăn khi trò chuyện nhóm ngay cả khi đã dùng máy trợ thính, và muốn giảm công sức cũng như mệt mỏi theo thời gian.6
  • Bạn có động lực luyện tập đều đặn (luyện ít mỗi ngày thường hiệu quả hơn những “buổi lớn” hiếm hoi).

“Cải thiện thực sự” thường trông như thế nào

  • Theo kịp chủ đề nhanh hơn (bạn vẫn định hướng được thay vì bị lạc khỏi cuộc nói chuyện).
  • Tự tin hơn trong việc yêu cầu nhắc lại sớm (trước khi hoàn toàn không theo kịp).
  • Biết tận dụng thông tin chưa đầy đủ tốt hơn (“Tôi nắm được 60% rồi, giờ có thể tự điền nốt phần còn lại”).
  • Ít mệt mỏi xã hội hơn vào cuối ngày (vì mức công sức thấp hơn).

Khẩu trang, râu và câu “làm ơn đừng nói vào cốc cà phê của bạn nữa được không?”

Khẩu trang có thể gây khó theo hai cách: chúng làm giảm khả năng nhìn thấy tín hiệu khuôn mặt, đồng thời cũng có thể thay đổi một số đặc điểm của tín hiệu lời nói. Nghiên cứu trong thời kỳ COVID-19 đã ghi nhận ảnh hưởng âm học của các loại khẩu trang phổ biến và tác động sau đó đối với khả năng hiểu lời nói trong môi trường ồn.910

Một kế hoạch dự phòng tốt (không cần gồng mình)

  • Đổi cách giao tiếp: dùng ghi chú nhanh trên điện thoại, tin nhắn hoặc gõ chữ.
  • Đổi chỗ: ánh sáng tốt hơn và ít ồn hơn thường hiệu quả hơn là “cố thêm nữa”.
  • Dùng gọi video thay vì chỉ gọi thoại khi có thể (nhìn thấy khuôn mặt sẽ giúp nhiều).
  • Dùng phụ đề khi có sẵn (TV, cuộc họp, điện thoại thông minh).11

Khi nào nên đi khám

Đừng cố “đọc khẩu hình để vượt qua” các triệu chứng khẩn cấp

Nếu bạn có thay đổi thính lực đột ngột, chóng mặt nặng hoặc chóng mặt xoay mới xuất hiện, yếu hoặc tê mặt, hay các triệu chứng khẩn cấp khác, hãy đi khám ngay. Xem: Hướng dẫn an toàn khẩn cấp về thính lực, ù tai và thăng bằng.

Công cụ bước tiếp theo (UCSF EARS)

Tóm tắt ngắn gọn

Đọc lời nói bằng mắt là có thật, hữu ích và có thể học được, nhưng nó không phải là phép màu. Những cải thiện nhanh nhất thường đến từ ánh sáng tốt hơn, vị trí tốt hơn, ngữ cảnh rõ ràng và kết hợp âm thanh với thị giác. Việc đào tạo có thể giúp, nhất là khi nó làm cho quá trình luyện tập đều đặn hơn và giảm công sức theo thời gian.

Câu hỏi thường gặp

“Đọc khẩu hình” có giống với “đọc lời nói bằng mắt” không?

Không hẳn. “Đọc lời nói bằng mắt” có nghĩa rộng hơn: nó bao gồm toàn bộ khuôn mặt, cử chỉ và ngữ cảnh (và thường cả một phần âm thanh). Trong đời sống hàng ngày, chính kỹ năng rộng hơn đó mới thường hữu ích nhất.7

Vì sao có người dường như bẩm sinh đã giỏi việc này?

Nghiên cứu luôn cho thấy có sự khác biệt rất lớn giữa từng người trong khả năng nhận biết lời nói bằng thị giác, giữa các cá nhân, nhiệm vụ và người nói. Một số nhóm (ví dụ như những người mất thính lực nặng từ sớm) có thể phát triển kỹ năng nhìn lời nói mạnh hơn ở mức trung bình, nhưng ngay trong bất kỳ nhóm nào vẫn có sự khác biệt rất rộng.2

Vì sao việc này khiến tôi thấy kiệt sức như vậy?

Bởi vì não bạn đang phải làm thêm việc: kết hợp thông tin cảm giác không đầy đủ và dự đoán ý nghĩa theo thời gian thực. Các mô hình về hiểu lời nói và “nghe đòi hỏi nhiều công sức” giải thích vì sao tín hiệu suy giảm làm tăng gánh nặng nhận thức và mệt mỏi.56

Nếu tôi dựa nhiều vào đọc lời nói bằng mắt, máy trợ thính vẫn có ích không?

Có. Thính giác và thị giác cùng nhau thường tốt hơn chỉ dùng riêng một trong hai, nhất là trong môi trường ồn. Ngay cả âm thanh không đầy đủ cũng có thể giúp làm rõ những cử động miệng dễ gây nhầm lẫn khi nhìn.3

Tài liệu tham khảo

Danh sách tài liệu tham khảo (nguồn lâm sàng và được bình duyệt)
  1. Demorest ME, Bernstein LE, DeHaven GP. Generalizability of speechreading performance on syllables, words, and sentences: Subjects with normal hearing. Journal of Speech and Hearing Research. 1996;39(4):697–713. doi: 10.1044/JSHR.3904.697.
  2. Auer ET Jr, Bernstein LE. Enhanced visual speech perception in individuals with early-onset hearing impairment. Journal of Speech, Language, and Hearing Research. 2007;50(5):1157–1165. doi: 10.1044/1092-4388(2007/081).
  3. Sumby WH, Pollack I. Visual contribution to speech intelligibility in noise. Journal of the Acoustical Society of America. 1954;26(2):212–215. doi: 10.1121/1.1907309.
  4. McGurk H, MacDonald J. Hearing lips and seeing voices. Nature. 1976;264:746–748. doi: 10.1038/264746a0.
  5. Rönnberg J, Lunner T, Zekveld A, et al. The Ease of Language Understanding (ELU) model: theoretical, empirical, and clinical advances. Frontiers in Systems Neuroscience. 2013;7:31. doi: 10.3389/fnsys.2013.00031. Truy cập mở.
  6. Pichora-Fuller MK, Kramer SE, Eckert MA, et al. Hearing impairment and cognitive energy: The Framework for Understanding Effortful Listening (FUEL). Ear and Hearing. 2016;37 Suppl 1:5S–27S. doi: 10.1097/AUD.0000000000000312.
  7. Bernstein LE, Jordan NC, Auer ET Jr, Eberhardt SP. Lipreading: A Review of Its Continuing Importance for Speech Recognition With an Acquired Hearing Loss and Possibilities for Effective Training. American Journal of Audiology. 2022;31:453–469. doi: 10.1044/2021_AJA-21-00112.
  8. Corey RM, Jones U, Singer AC. Acoustic effects of medical, cloth, and transparent face masks on speech signals. Journal of the Acoustical Society of America. 2020;148(4):2371. doi: 10.1121/10.0002279.
  9. Toscano JC, Toscano CM. Effects of face masks on speech recognition in multi-talker babble noise. PLOS ONE. 2021;16(2):e0246842. doi: 10.1371/journal.pone.0246842. Truy cập mở.
  10. National Institute on Deafness and Other Communication Disorders (NIDCD). Assistive Devices for People with Hearing, Voice, Speech, or Language Disorders. NIH (giáo dục cho người bệnh). Tài nguyên.