Hội Nội tiết sinh sản và Vô sinh TPHCM
HOSREM - Ho Chi Minh City Society for Reproductive Medicine

Tin tức
on Wednesday 02-07-2025 10:18pm
Viết bởi: ngoc
Danh mục: Tin quốc tế

ThS. Hồ Lan Trâm - IVFMD Tân Bình

Giới thiệu
Phần lớn người dân hiện nay tìm kiếm thông tin y tế qua Internet. Tuy nhiên, với những người đang đối mặt với vấn đề vô sinh, đặc biệt là những người căng thẳng hoặc trầm cảm, các kết quả tìm kiếm trực tuyến truyền thống thường không đáp ứng đầy đủ nhu cầu của họ. Các website của phòng khám hỗ trợ sinh sản thường cung cấp thông tin sai lệch hoặc không đầy đủ và không được thiết kế để phục vụ đa dạng các nhóm người sử dụng dịch vụ. Bên cạnh đó, cộng đồng “bệnh nhân vô sinh” là một nhóm rất rộng và đa dạng, từ những người được chẩn đoán vô sinh rõ ràng, người suy giảm khả năng sinh sản do độ tuổi, người đồng tính hoặc độc thân có nhu cầu sinh con, hay những người có nhu cầu bảo tồn khả năng sinh sản. Trong nhóm này, bên cạnh những vấn đề quan tâm về phương pháp điều trị, các vấn đề khác như tài chính, tâm lý, mặt hậu cần cũng được quan tâm, nhưng những vấn đề này sẽ không được các trang web của phòng khám đề cập đến. Đặc biệt, đối với những nhóm vô sinh không rõ nguyên nhân, người đang cân nhắc sử dụng các phương pháp bổ sung khi thực hiện IVF, hoặc phụ nữ trữ noãn chủ động, việc tiếp cận thông tin y khoa độc lập, dựa trên bằng chứng là điều rất khó khăn. Một phần lý do đến từ mô hình tài chính tư nhân của ngành hỗ trợ sinh sản, khiến Internet trở thành nơi tập trung nhiều nội dung quảng cáo hơn là thông tin tư vấn trung lập. Bên cạnh đó, việc sử dụng mạng xã hội càng nhiều, điều này dù có giá trị trong việc chia sẻ kinh nghiệm cá nhân, vẫn có nguy cơ lan truyền những thông tin sai lệch và chưa được kiểm chứng.
Sự ra đời của các mô hình trí tuệ nhân tạo (Artificial intelligence-AI) như ChatGPT (Generative Pre-trained Transformer) vào tháng 11/2022, dựa trên công nghệ giúp xử lý ngôn ngữ tự nhiên đã mở ra một cách tiếp cận mới trong việc tra cứu thông tin y khoa bên cạnh cách tra cứu thông tin truyền thống trên Google.
ChatGPT hoạt động tương tự tính năng “dự đoán từ” và phản ánh trung bình của dữ liệu huấn luyện. Dù có tiềm năng hữu ích, nhưng độ chính xác và thiên lệch trong thông tin vẫn là những thách thức lớn, đặc biệt là khi dữ liệu huấn luyện không rõ nguồn gốc hoặc khi người dùng đặt câu hỏi không tối ưu.
Chất lượng thông tin từ các nguồn trực tuyến truyền thống về hỗ trợ sinh sản
Các nghiên cứu cho thấy chất lượng thông tin được cung cấp trên nhiều trang web của phòng khám kém, bệnh nhân không nhận được thông tin mà họ cần để đưa ra quyết định sáng suốt. Hơn nữa, các nguồn thông tin được sử dụng thường xuyên và dễ tiếp cận nhất trên internet không phải lúc nào cũng là những nguồn đáng tin cậy nhất. Trong một  khảo sát gần đây của Grace và cộng sự vào 2023 cho thấy nguồn thông tin quá lớn khiến người tìm khiến nản lòng và chất lượng thông tin không đáng tin cậy đặc biệt là khi so sánh với ý kiến ​​từ chuyên gia. Bên cạnh đó, mạng xã hội được coi là nguồn trực tuyến kém tin cậy nhất. Thông tin ở đây thúc đẩy theo tâm lý đám đông và gây ra cảm xúc tiêu cực, đi kèm đó là các vấn đề về độ tin cậy, tính bảo mật và việc phát tán thông tin sai lệch.
Mặc dù còn nhiều hạn chế, thông tin trên các website của phòng khám hỗ trợ sinh sản và mạng xã hội vẫn được nhiều bệnh nhân đánh giá là có giá trị hỗ trợ trong quá trình ra quyết định điều trị. Nhưng những nội dung này thường chỉ mang tính hướng dẫn chung, giúp người bệnh định hướng hành trình chăm sóc, chứ không thể thay thế cho việc tham vấn y khoa chuyên sâu.
Đánh giá chất lượng thông tin về hỗ trợ sinh sản do ChatGPT cung cấp
Trước tình trạng thông tin về vô sinh trên các website phòng khám và mạng xã hội thường kém chất lượng, vào đầu năm 2023, nhóm nghiên cứu đặt ra câu hỏi: Liệu thông tin do ChatGPT cung cấp về hỗ trợ sinh sản có chính xác không?
Tác giả thiết kế 10 câu hỏi mô phỏng các thắc mắc phổ biến của bệnh nhân vô sinh, bao gồm cả chủ đề ít gây tranh cãi (ví dụ: những kiến thức cơ bản về sinh sản) lẫn các chủ đề nhạy cảm hoặc còn tranh luận (như: AMH, trữ noãn chủ động, thời điểm dừng điều trị,...). Chất lượng của câu trả lời từ ChatGPT được đánh giá bởi chuyên gia. Kết quả cho thấy ChatGPT xử lý các câu hỏi khá tốt: 5/10 câu trả lời được đánh giá chất lượng cao, 4/10 chất lượng trung bình và 1/10 kém. Phản hồi chất lượng kém liên quan đến thông tin gây tranh cãi về các phương pháp bổ sung khi thực hiện IVF. Một nghiên cứu khác của Chervenak và cộng sự vào năm 2023 cũng cho thấy ChatGPT hoạt động tốt khi thực hiện các yêu cầu ở 3 lĩnh vực khác nhau bao gồm trả lời câu hỏi các câu hỏi vô sinh phổ biến từ của Trung tâm Kiểm soát và Phòng ngừa Dịch bệnh (CDC), hoàn thành khải sát cho bệnh nhân liên quan đến sinh sản và bổ sung thông tin còn thiếu trong 7 tuyên bố đồng thuận của Hiệp hội Y học Sinh sản Hoa Kỳ (ASRM). Tuy nhiên, một số vấn đề quan trọng được nêu bao gồm văn phong mang tính thuyết phục có thể che lấp lỗi sai hoặc làm người đọc ngộ nhận độ tin cậy. Không trích dẫn nguồn hoặc trích dẫn sai, đôi khi tạo cảm giác “gần giống người thật nhưng gây khó chịu”. Xuất hiện hiện tượng “Hallucination”, tạo ra nội dung nghe có vẻ hợp lý nhưng sai ngữ cảnh, sai khoa học hoặc vô nghĩa.
Nguyên nhân có thể đến từ dữ liệu huấn luyện cho ChatGPT chứa thông tin lỗi thời hoặc sai lệch, đặc biệt về phương pháp bổ sung liên quan IVF. Câu hỏi quá rộng, thiếu ngữ cảnh rõ ràng, ví dụ như: “Các phương pháp bổ sung giúp tôi dễ mang thai hơn?”, loại câu hỏi giống tìm kiếm Google, nhưng không có cơ chế lọc và đánh giá nguồn như Google cung cấp. Ngoài ra, quy trình huấn luyện ChatGPT không minh bạch, người ta chỉ biết rằng có sử dụng 570GB dữ liệu từ các nguồn không công bố, và có can thiệp kiểm duyệt thủ công bởi con người, nhưng cách thực hiện cũng không rõ ràng. Tóm lại, dù ChatGPT hoạt động khá tốt trong nhiều trường hợp, vẫn còn những giới hạn lớn về độ tin cậy, đặc biệt khi thông tin đào tạo còn nhiễu, câu lệnh chưa tối ưu, hoặc thuộc về các chủ đề còn gây tranh cãi.
So sánh ChatGPT và Google trong việc tìm kiếm thông tin y khoa
Một nghiên cứu gần đây trong lĩnh vực hậu phẫu cho thấy ChatGPT có hiệu suất bằng hoặc vượt trội so với Google khi so sánh với hướng dẫn bệnh viện và các kết quả tìm kiếm phổ biến nhất. Dù không vượt qua được thông tin chính thống từ các cơ sở y tế, ChatGPT cho thấy khả năng tổng hợp thông tin từ nhiều nguồn, tạo ra câu trả lời đầy đủ và có chiều sâu, đặc biệt nếu dữ liệu huấn luyện được cập nhật và nhất quán.
 ChatGPT thể hiện khả năng kết nối nhiều lĩnh vực chăm sóc sức khỏe, để tạo ra những câu trả lời mang tính toàn diện, điều mà người dùng sẽ phải thực hiện qua nhiều lượt tìm kiếm Google mới có được. Tuy nhiên, với những chủ đề thiếu dữ liệu vững chắc, các câu trả lời từ ChatGPT có xu hướng bị thiên về hướng tích cực, do ảnh hưởng từ dữ liệu quảng cáo của các phòng khám, mạng xã hội hoặc nội dung thương mại. Ngoài ra, nhu cầu thông tin của từng người dùng là rất khác nhau và tùy vào hoàn cảnh cá nhân. Việc tùy chỉnh câu lệnh để đưa rõ hoàn cảnh có thể giúp AI phản hồi sát hơn, giống như cách một bác sĩ chuyên ngành tư vấn cá nhân hóa cho bệnh nhân, điều mà các thuật toán đơn thuần không thể làm được.
Bất kể dùng nguồn nào, người tìm kiếm thông tin về hỗ trợ sinh sản xứng đáng được tiếp cận thông tin chính xác, minh bạch và dựa trên bằng chứng. Trong bối cảnh ngành hỗ trợ sinh sản còn nhiều thông tin thiên lệch, nếu được huấn luyện tốt và minh bạch về dữ liệu, ChatGPT có thể trở thành một kênh thông tin hữu ích và công bằng cho người dùng. Đáng chú ý, trong nghiên cứu này, ChatGPT còn thể hiện khả năng đề xuất người dùng xem xét cả khía cạnh tâm lý, tài chính, chứ không chỉ tập trung vào tỷ lệ thành công điều trị, điều mà chính các chuyên gia sinh sản đôi khi bỏ sót, vì tư vấn tâm lý và tài chính không phải chuyên môn cốt lõi.
Liệu rằng bác sĩ ChatGPT có đủ trình độ hành nghề không?
ChatGPT đã vượt qua nhiều kỳ thi thiết kế cho con người, phản ánh khả năng truy xuất và vận dụng thông tin trong ngữ cảnh phù hợp. Chẳng hạn, nó đã đạt điểm đậu trong kỳ thi y khoa năm 3 và bốn môn luật cơ bản. Quan trọng hơn, các phiên bản mới hơn cho thấy sự tiến bộ rõ rệt. Phiên bản ChatGPT-4 đạt 90,5% trong một kỳ thi da liễu, cao hơn nhiều so với 63,1% từ ChatGPT-3, đây là minh chứng cho sự cải thiện đáng kể về hiệu suất trong thời gian rất ngắn. Tuy nhiên, liệu ChatGPT có đủ năng lực cung cấp thông tin y khoa chính xác và đáng tin cho bệnh nhân một cách nhất quán? Theo chính ChatGPT, câu trả lời là không. Trong cuộc phỏng vấn với chuyên gia về hỗ trợ sinh sản David Asch được đăng trên tạp chí New England Journal of Medicine vào năm 2023, ChatGPT là công cụ hỗ trợ xử lý dữ liệu quy mô lớn, nhưng không thể thay thế “cái chạm của con người” trong hành nghề y. Asch cũng cảnh báo rằng dữ liệu lớn có thể khuếch đại cả hiệu quả lẫn sai lệch, điều mà trước đây Bill Gates từng nhấn mạnh. Khi được David Sable thử yêu cầu thiết kế kế hoạch điều trị một trường hợp vô sinh do tắc vòi trứng, ChatGPT đưa ra câu trả lời tương đối ổn, nhưng vẫn có những điểm chưa chính xác. Một nghiên cứu khác cho thấy, khi sử dụng câu lệnh đơn giản, ChatGPT đạt độ chính xác 80%; nhưng khi câu lệnh mang hàm ý gợi dẫn kỳ vọng của người hỏi, độ chính xác giảm còn 64%. Một vấn đề lớn trong câu trả lời của ChatGPT là việc không dẫn nguồn rõ ràng. ChatGPT không lưu lịch sử cuộc trò chuyện lâu dài và phản hồi của nó dựa vào mẫu ngôn ngữ sử dụng, không phải hiểu biết thực sự. Việc gán nguồn chính xác là yếu tố then chốt để cải thiện chất lượng và độ tin cậy của thông tin do AI tạo ra.
Kết luận
Các mô hình AI như ChatGPT là công cụ mới mẻ và tiềm năng trong việc truy xuất thông tin y tế, đặc biệt trong bối cảnh dữ liệu số bùng nổ. So với tìm kiếm Google, các nghiên cứu cho thấy ChatGPT nhanh và chính xác tương đương cho các câu hỏi đơn giản, đồng thời thu hẹp khoảng cách tiếp cận thông tin giữa các nhóm dân số có trình độ học vấn khác nhau. Tuy nhiên, thay vì phụ thuộc vào các mô hình công cộng, các tổ chức y tế nên phát triển AI của riêng mình, dựa trên nguồn dữ liệu tin cậy. Để khai thác hiệu quả ChatGPT, người dùng cần hiểu cách nó hoạt động và biết cách đặt câu lệnh tốt. Song song đó, chúng ta cũng phải giải quyết các vấn đề đạo đức như: quyền riêng tư, trách nhiệm, thiên lệch và lòng tin. Cuối cùng, các chuyên gia y tế với kinh nghiệm thực hành vẫn có lợi thế vượt trội, vì họ không chỉ cung cấp thông tin mà còn mang lại sự cảm thông và chăm sóc cá nhân hóa, điều mà AI chưa thể thay thế.

Tài liệu tham khảo
Kiri Beilby, Karin Hammarberg, ChatGPT: a reliable fertility decision-making tool?, Human Reproduction, Volume 39, Issue 3, March 2024, Pages 443–447, https://doi.org/10.1093/humrep/dead272


Các tin khác cùng chuyên mục:
TIN CẬP NHẬT
TIN CHUYÊN NGÀNH
LỊCH HỘI NGHỊ MỚI
Năm 2020

Tiền Hội nghị: Trung tâm Hội nghị Grand Saigon, thứ bảy ngày ...

Năm 2020
Năm 2020

Vinpearl Landmark 81, ngày 9-10 tháng 8 năm 2025

GIỚI THIỆU SÁCH MỚI

Kính mời quý đồng nghiệp quan tâm đến hỗ trợ sinh sản tham ...

Y học sinh sản số 73 (Quý I . 2025) ra mắt ngày 20 . 3 . 2025 và ...

Sách ra mắt ngày 6 . 1 . 2025 và gửi đến quý hội viên trước ...

Hội viên liên kết Bạch kim 2024
Hội viên liên kết Vàng 2024
Hội viên liên kết Bạc 2024
FACEBOOK