KS. Nguyễn Thanh Tuyên – IVF Mỹ Đức Gia Định, Bệnh viện Đa khoa Gia Định

 

Giới thiệu

Từ khi kỹ thuật thụ tinh trong ống nghiệm (In-vitro fertilization IVF) ra đời năm 1978, đến nay đã có hơn 8 triệu trẻ ra đời trên toàn thế giới [1]. Thành công của IVF và việc hạn chế nguy cơ đa thai phụ thuộc chủ yếu vào việc lựa chọn phôi bình thường, chất lượng cao, mà yếu tố then chốt chính là tình trạng nhiễm sắc thể (ploidy). Phôi nguyên bội (euploid) thường có khả năng làm tổ cao và duy trì thai kỳ thành công, trong khi phôi lệch bội (aneuploid) là nguyên nhân chính dẫn đến thất bại làm tổ, sảy thai hoặc các dị tật di truyền.

Phương pháp phổ biến hiện nay để xác định ploidy của phôi là xét nghiệm di truyền trước làm tổ (Preimplantation Genetic Testing PGT). Tuy nhiên, đây là kỹ thuật xâm lấn, chi phí cao, yêu cầu kỹ thuật phức tạp, có thể ảnh hưởng đến sự phát triển của phôi. Thêm vào đó, hiện tượng khảm (mosaicism) dễ gây sai lệch kết quả, làm giảm độ chính xác và hiệu quả lâm sàng.

Do đó, các phương pháp không xâm lấn đang thu hút nhiều sự quan tâm, trong đó nổi bật là hệ thống nuôi cấy phôi kết hợp camera quan sát liên tục (Time-Lapse monitoring – TLM). TLM là hệ thống tủ nuôi cấy tích hợp camera độ phân giải cao được kết nối với máy tính bên ngoài. Trong suốt quá trình nuôi cấy, hình ảnh phôi được chụp định kỳ ở nhiều tiêu cự và ghép lại thành chuỗi video, cho phép theo dõi toàn bộ tiến trình phát triển từ thụ tinh đến khi hình thành phôi nang mà không cần đưa phôi ra khỏi môi trường nuôi cấy [2]. Nhờ vậy, phôi luôn được duy trì trong điều kiện nhiệt độ và nồng độ khí ổn định, giảm thiểu tối đa các tác động bên ngoài, đồng thời cung cấp dữ liệu động học hình thái phôi toàn diện về quá trình phân chia và phát triển của phôi [3]. Tuy nhiên, việc phân tích dữ liệu TLM để dự đoán độ bội của phôi vẫn còn nhiều hạn chế.

Sự phát triển của trí tuệ nhân tạo (artificial intelligence – AI) cùng với nguồn dữ liệu lớn từ TLM đã thúc đẩy sự ra đời của nhiều mô hình tự động đánh giá phôi. Một số nghiên cứu đã ứng dụng học sâu (deep learning) trong phân tích hình ảnh và thông số động học phát triển của phôi để dự đoán các kết cục lâm sàng như khả năng làm tổ hay tỷ lệ trẻ sinh sống, với độ chính xác rất cao (AUC > 0,9). Tuy nhiên, nghiên cứu AI trong dự đoán ploidy của phôi vẫn còn hạn chế. Gần đây, Chavez-Badiola (2020) và Bori (2021) đã thử nghiệm các mô hình AI kết hợp TLM để dự đoán ploidy. Tiếp nối các nghiên cứu này, Huang và cộng sự (2021) phát triển mô hình Euploid Prediction Algorithm (EPA); Barnes và cộng sự (2023) giới thiệu mô hình STORK-A; trong khi Rajendran và cộng sự (2024) giới thiệu mô hình BELA – một bước tiến mới với quy mô đa trung tâm.

Phương pháp

Mô hình EPA [4]: Đây là nghiên cứu đoàn hệ hồi cứu, tiến hành tại Trung tâm Y học Sinh sản, Bệnh viện Tongji (Trung Quốc). Tổng cộng 1.803 phôi nang từ 469 chu kỳ PGT-A được chọn lựa và phân tích. Toàn bộ phôi được nuôi cấy trong hệ thống Embryoscope Plus (Vitrolife). Dữ liệu hình ảnh được chia thành ba nguồn dữ liệu: training set, validation set và test set, nhằm phát triển và đánh giá hiệu quả mô hình EPA. Để kiểm chứng hiệu quả, nhóm nghiên cứu còn sử dụng thêm một bộ dữ liệu độc lập (ngoại sinh) gồm 523 phôi nang từ 155 chu kỳ PGT-A. Mô hình EPA được phát triển dựa trên các thông số động học từ dữ liệu TLM và áp dụng thuật toán để phân loại phôi euploid hoặc aneuploid.

Mô hình STORK-A [5]: STORK-A được phát triển và kiểm chứng thông qua một nghiên cứu hồi cứu quy mô lớn trên 10.378 phôi người đã có kết quả PGT-A — một nguồn dữ liệu lớn giúp tăng cường độ tin cậy vượt trội so với các nghiên cứu trước đây. Về phương pháp, mô hình ứng dụng mạng nơ-ron tích chập (Convolutional Neural Networks - CNN) để trích xuất đặc trưng từ hình ảnh phôi nang tại mốc 110 giờ sau ICSI, sau đó hợp nhất với các biến lâm sàng như tuổi mẹ, đặc điểm hình thái và thông số động học để dự đoán tình trạng nguyên bội. Nhằm đảm bảo tính khách quan, mô hình không chỉ được huấn luyện nội bộ mà còn được đánh giá độc lập trên các bộ dữ liệu ngoại sinh từ nhiều trung tâm IVF khác nhau, qua đó khẳng định độ ổn định và khả năng tổng quát hóa trong các môi trường lâm sàng đa dạng.

Mô hình BELA [1]: Khác với EPA chỉ dựa vào dữ liệu đơn trung tâm, BELA được huấn luyện và kiểm chứng trên nhiều bộ dữ liệu đa trung tâm, với hơn 4.000 phôi nang từ các cơ sở IVF tại Mỹ và châu Âu. Phôi được nuôi cấy trong các hệ thống Time-Lapse khác nhau, sau đó gắn nhãn bằng PGT-A. Chuỗi ảnh được chuẩn hóa về mốc thời gian, đặc trưng hình ảnh được trích xuất bằng CNN VGG16, và mô hình BiLSTM đa nhiệm được dùng để dự đoán các thông số hình thái (khối tế bào nội mô “Inner Cell Mass – ICM”, lớp tế bào lá nuôi “Trophectoderm – TE”, độ nở rộng). Sau đó, điểm phôi nang do mô hình tạo ra (model-derived blastocyst scores – MDBS) kết hợp với tuổi mẹ được đưa vào hồi quy logistic để dự đoán tình trạng ploidy. BELA còn được triển khai dưới dạng ứng dụng web (STORK-V), hỗ trợ sử dụng trực tiếp trong lâm sàng.

Kết quả

Mô hình EPA cho thấy khả năng dự đoán được tình trạng nguyên bội và lệch bội của phôi với AUC = 0,80. Khi áp dụng trên bộ dữ liệu ngoại sinh, mô hình vẫn duy trì hiệu quả dự đoán ổn định, chứng minh hiệu năng của nó. Các chỉ số độ nhạy và độ đặc hiệu cho thấy mô hình EPA có thể hỗ trợ đáng tin cậy cho quá trình chọn lọc phôi nguyên bội. So với PGT-A, EPA tuy chưa đạt mức độ chính xác tương đương, nhưng có ưu thế là không xâm lấn, an toàn cho phôi và tiết kiệm chi phí. Nghiên cứu cũng cho thấy dữ liệu thông số động học phát triển phôi từ TLM chứa đựng nhiều thông tin liên quan mật thiết đến ploidy, khẳng định tiềm năng ứng dụng mô hình trong thực hành lâm sàng.

Mô hình STORK-A cho thấy khả năng dự đoán tình trạng nguyên bội ở mức khả quan so với các phương pháp không xâm lấn hiện nay. Khả năng phân biệt phôi nguyên bội và lệch bội với độ chính xác đạt khoảng 69% với AUC = 0,76. Đặc biệt, trong phân loại lệch bội phức tạp, hiệu năng cải thiện rõ rệt với độ chính xác lên đến khoảng 77% và AUC = 0,85. Khi kiểm chứng trên dữ liệu độc lập từ hai trung tâm khác, độ chính xác vẫn ổn định trong khoảng 63–66%, cho thấy mô hình có khả năng tổng quát hóa. Ngoài ra, trong phân tích hậu kiểm lâm sàng, những phôi được mô hình dự đoán là euploid có tỷ lệ tim thai và trẻ sinh sống tương đương nhóm được xác định phôi nguyên bội bằng PGT-A.

Kết quả của mô hình BELA cho thấy AUC = 0,82 – cao hơn EPA và nhiều mô hình trước đó. Điểm nổi bật là BELA duy trì hiệu năng ổn định trên cả dữ liệu nội bộ và ngoại sinh, chứng minh tính khái quát cao. Nhờ việc tích hợp tuổi mẹ cùng các thuật toán học sâu tiên tiến, BELA có khả năng nhận diện hiệu quả cả các trường hợp lệch bội phức tạp. Việc triển khai thành ứng dụng web giúp mô hình tiến gần hơn đến ứng dụng thực tế trong lab IVF.

Kết luận và khuyến nghị

Mô hình EPA là bằng chứng quan trọng chứng minh tính khả thi của việc dự đoán ploidy của phôi bằng AI + TLM. Đây là hướng tiếp cận hứa hẹn, mở ra khả năng lựa chọn phôi hiệu quả mà không cần can thiệp xâm lấn. Tuy nhiên, EPA hiện vẫn chỉ là một bước khởi đầu và chưa thể thay thế hoàn toàn PGT-A.

STORK-A chứng minh tiềm năng trở thành một công cụ hỗ trợ lựa chọn phôi không xâm lấn, chuẩn hóa và chi phí hợp lý hơn so với PGT-A. Mặc dù chưa thể thay thế hoàn toàn sinh thiết phôi trong giai đoạn hiện tại, mô hình có thể giúp ưu tiên phôi tốt để chuyển hoặc phôi phù hợp để làm PGT-A, góp phần nâng cao hiệu quả điều trị IVF và hướng đến mục tiêu sàng lọc nguyên bội mà không cần can thiệp vào phôi.

Trong khi đó, BELA của Rajendran và cộng sự (2024) đã mở rộng quy mô nghiên cứu lên mức đa trung tâm, đạt độ chính xác cao hơn và có khả năng ứng dụng lâm sàng tốt hơn nhờ triển khai thành công cụ trực tuyến. Sự khác biệt này cho thấy sự phát triển nhanh chóng của lĩnh vực AI + TLM, từ các thử nghiệm đơn trung tâm đến những mô hình đa trung tâm với tiềm năng áp dụng rộng rãi.

Nhìn chung, cả ba mô hình EPA, STORK-A và BELA đều khẳng định tiềm năng của AI trong việc dự đoán tình trạng nhiễm sắc thể của phôi. Cần thực hiện thêm các nghiên cứu tiền cứu, đa trung tâm, tích hợp thêm dữ liệu lâm sàng (tuổi mẹ, chỉ số nội tiết, đặc điểm tinh trùng) cũng như kết hợp với các dấu ấn sinh học không xâm lấn (metabolomics, proteomics). Sự kết hợp đa mô thức có thể tạo ra những mô hình toàn diện hơn, vừa nâng cao độ chính xác, vừa tăng tính ứng dụng thực tế, góp phần hướng tới một nền y học sinh sản chính xác và cá thể hóa. Ngoài ra, các mô hình này giúp giảm áp lực tâm lý cho bệnh nhân và tối ưu hóa tài nguyên hệ thống y tế khi giảm bớt các ca sinh thiết không cần thiết.

 

Tài liệu tham khảo

[1]      S. Rajendran et al., “Automatic ploidy prediction and quality assessment of human blastocysts using time-lapse imaging,” Nat. Commun., vol. 15, no. 1, p. 7756, Sep. 2024, doi: 10.1038/s41467-024-51823-7.

[2]      R. AlSaad et al., “Deep learning applications for human embryo assessment using time-lapse imaging: scoping review.,” Frontiers in reproductive health, vol. 7, p. 1549642, 2025, doi: 10.3389/frph.2025.1549642.

[3]      I. Rubio et al., “Clinical validation of embryo culture and selection by morphokinetic analysis: a randomized, controlled trial of the EmbryoScope,” Fertil. Steril., vol. 102, no. 5, pp. 1287-1294.e5, Nov. 2014, doi: 10.1016/j.fertnstert.2014.07.738.

[4]      B. Huang, W. Tan, Z. Li, and L. Jin, “An artificial intelligence model (euploid prediction algorithm) can predict embryo ploidy status based on time-lapse data,” Reproductive Biology and Endocrinology, vol. 19, no. 1, p. 185, Dec. 2021, doi: 10.1186/s12958-021-00864-4.

[5]      J. Barnes et al., “A non-invasive artificial intelligence approach for the prediction of human blastocyst ploidy: a retrospective model development and validation study,” Lancet Digit. Health, vol. 5, no. 1, pp. e28–e40, Jan. 2023, doi: 10.1016/S2589-7500(22)00213-8.