Multimodal AI for Predicting IVF Pregnancy Outcomes

Original Title: Multimodal intelligent prediction model for in vitro fertilization

Journal: NPJ digital medicine

DOI: 10.1038/s41746-025-02331-5

Overview

This study introduces VaTEP, a multimodal deep learning framework that integrates time-lapse system videos of developing embryos with tabular clinical data. Developed and validated using data from 9,786 participants across three medical centers, VaTEP predicts three clinical outcomes: fetal heartbeat presence, singleton versus multiple pregnancy, and miscarriage versus live birth. Using a multi-task learning approach, the system optimizes these predictions simultaneously. Results show the model achieved an area under the curve (AUC) of 0.8000 for fetal heartbeat, 0.8823 for singleton versus multiple pregnancy, and 0.9258 for live birth versus miscarriage. These values exceeded the performance of senior embryologists. Analysis identified maternal age, anti-Müllerian hormone levels, and endometrial thickness as significant variables informing the model's decisions. The framework provides a quantitative tool for embryo selection accounting for both embryonic development and maternal physiology.

Novelty

The novelty lies in the integrated end-to-end architecture and specific pre-training tasks for enhanced video representation. Unlike models that treat video and clinical data separately, this approach uses a cross-attention mechanism for deep interaction between modalities. A technical contribution is the use of two pre-training tasks: video reconstruction and embryo developmental phase prediction. These allow the encoder to learn spatiotemporal patterns and biological milestones before fine-tuning for outcomes. The model also uses a multiple frame sampling strategy to capture information from the entire developmental sequence efficiently. Expanding prediction targets to include multiple pregnancy risks and live birth outcomes represents a comprehensive approach. This multi-task framework enables feature sharing across related clinical endpoints, improving generalization compared to single-task systems.

Potential Clinical / Research Applications

Clinical and research applications include using this technology as a standardized decision-support tool to reduce multiple pregnancies. By identifying embryos with the highest live-birth potential, clinicians can confidently recommend single embryo transfers, minimizing risks like preterm birth. In research, the model's identification of influential variables, such as hormone levels, helps scientists understand the interaction between embryonic quality and uterine receptivity. The framework could be adapted to other medical tasks involving temporal data, such as monitoring fetal development or analyzing endoscopic videos. Since the model uses accessible clinical data and standard imaging, it could be deployed in resource-limited settings where expensive genetic testing is unavailable, helping to standardize care quality across different regions.

Similar Posts

  • Amyloid and Vascular Subtypes in Alzheimer’s Disease

    Original Title: Biomarkers Journal: Alzheimer's & dementia : the journal of the Alzheimer's Association DOI: 10.1002/alz70856_100574 Overview Alzheimer’s disease is a heterogeneous condition often occurring alongside cerebral small vessel disease. This study examines 262 individuals across two cohorts: the longitudinal TRIAD cohort, representing a low burden of small vessel disease, and the MITNEC-C6 cohort, which includes real-world patients with mixed dementia and moderate-to-severe vascular lesions. Using a deep learning segmentation tool and the Subtype and Stage Inference algorithm, the research team identified distinct imaging-derived subtypes based on amyloid deposition, white matter hyperintensities, perivascular spaces, and diffusion markers. The study tracked 202 individuals at baseline, with follow-ups at two and three…

  • Harnessing protein language model for structure-based discovery of highly efficient and robust PET hydrolases

    Title AI-Driven Discovery of Efficient PET Hydrolases One-Sentence Summary This study introduces a computational pipeline using a protein language model and structure-based search to discover a novel, highly efficient, and thermostable PET hydrolase from nature. Overview Polyethylene terephthalate (PET) plastic waste poses a significant environmental problem. While some enzymes, known as PET hydrolases (PETases), can break down PET, their performance is often limited. This research introduces VenusMine, a computational pipeline designed to discover new and more effective PETases. The process began by using the known structure of an existing enzyme, IsPETase, as a template to search for structurally similar proteins from vast biological databases. A protein language model (PLM) was…

  • Regulating ICU AI: From Narrow Tools to Generalist Systems

    Original Title: The regulation of artificial intelligence in intensive care units: from narrow tools to generalist systems Journal: NPJ digital medicine DOI: 10.1038/s41746-026-02535-3 Overview Intensive care units represent highly data-intensive environments in healthcare, requiring continuous monitoring and rapid decision-making. While artificial intelligence has been explored for decades, its formal regulation as a medical device began in 1995. By May 2025, the number of approved artificial intelligence-enabled medical devices reached 1,016 in the United States. Many of these tools are designed for narrow, single-task applications such as interpreting radiological images or predicting sepsis. The emergence of generative artificial intelligence and large language models marks a shift toward generalist systems capable of…

  • Staging of Alzheimer’s disease progression in Down syndrome using mixed clinical and plasma biomarker measures with machine learning

    論文「ダウン症候群におけるアルツハイマー病進行の機械学習を用いた臨床・血漿バイオマーカー混合指標によるステージング」の要約 タイトル 機械学習がダウン症候群におけるアルツハイマー病をステージング 1文での要約 本研究では、機械学習モデルを用いてダウン症候群の成人における認知機能と血漿バイオマーカーの変化の順序を明らかにし、一般集団と同様の前臨床期アルツハイマー病の進行パターンを明らかにしました。 概要 ダウン症候群(DS)の人は、遺伝的にアルツハイマー病(AD)のリスクが高いですが、その前臨床段階における一連の事象は完全には解明されていません。本研究は、まだ臨床的な認知症を発症していないDSの成人57名を対象に、ADの進行を調査しました。研究者らは、イベントベースモデル(EBM)と呼ばれる教師なし機械学習技術を用いて、認知機能テストと血漿バイオマーカー(アミロイドベータ(Aβ)42/40比、リン酸化タウ(p-tau)、神経フィラメント軽鎖(NfL)、グリア線維性酸性タンパク質(GFAP)など)の横断的データを分析しました。このモデルは、病理学的変化が起こる最も可能性の高い順序を推定しました。結果として、最も早期に検出された事象は血漿Aβ42/40比の低下であり、その直後に記憶能力の低下が続くことが示されました。続いて、神経変性マーカー(NfLおよびp-tau)に変化が生じ、これは実行機能および視覚運動機能の低下に先行していました。この一連の変化の最後の事象は、神経炎症マーカーであるGFAPの変化でした。さらなる分析により、39歳から52歳がこれらの血漿バイオマーカーが最も急速に変化する期間であることが特定されました。 新規性 本研究の主な貢献は、DSにおける前臨床ADをステージングするために、認知機能評価と血漿バイオマーカーの両方を統合するイベントベースモデルを適用した点にあります。これまでの研究では、これらのモダリティを別々に検討することが多かったのに対し、本研究はこの特定の集団において、両者をデータ駆動型の手法で組み合わせた最初の研究の一つです。このマルチモーダルなアプローチは、単一の種類のデータを分析するよりも、より全体的で頑健な疾患進行のタイムラインを提供します。臨床的マーカーと生物学的マーカーを組み合わせた順序付けを行うことで、このモデルは単純な相関関係を超え、横断的データに基づいて病理学的事象の起こりうる時間的順序を確立し、前臨床段階のカスケードのより詳細な全体像を提示します。 私の視点 データ駆動型のアプローチであるEBMの利用は特に説得力があると感じます。なぜなら、このモデルはアミロイドカスケード仮説のような既存の仮説をデータに押し付けないからです。モデルが独自に決定した変化の順序は、結果的にカスケード仮説と一致しており、DSの文脈におけるこの枠組みの妥当性を強固なものにしています。しかし、このモデルのバイアスのかからない性質は、もしデータが異なるパターンを支持していれば、それを検出できたであろうことを意味し、複雑な疾患を研究する上でのこのような予断を持たないアプローチの価値を浮き彫りにします。さらに、横断的データから縦断的な進行を推測できる能力は、特に長期的な研究が困難な集団にとって強力なツールです。この手法は疾患の軌跡を描くための実用的なテンプレートを提供しますが、その知見は縦断的データセットによる検証によってさらに確固たるものとなるでしょう。 臨床・研究への応用の可能性 この研究成果は、臨床実践と研究の両方に直接的な示唆を与えます。臨床的には、EBMによって提供される個別のステージングは、特定の前臨床段階でどのマーカーが異常を示す可能性が高いかを特定することにより、早期診断を向上させる可能性があります。研究面では、39歳から52歳の間というバイオマーカー変化の重要な期間を特定したことで、臨床試験のデザインを最適化するための強力な根拠がもたらされます。疾患修飾薬の試験では、治療効果を観察できる可能性を最大化するために、この年齢層の参加者を特異的に募集することが考えられます。また、脳脊髄液分析やPETイメージングよりも侵襲性が低くアクセスしやすい血漿バイオマーカーに依存することで、DS集団における将来のAD予防試験の実現可能性と拡張性を向上させることもできるでしょう。

  • Plexin-B2 in CTC Clustering and Breast Cancer Metastasis

    Original Title: Computational ranking identifies Plexin-B2 in circulating tumor cell clustering with monocytes in breast cancer metastasis Journal: Nature communications DOI: 10.1038/s41467-025-62862-z Overview Circulating tumor cell (CTC) clusters are significantly more effective at seeding metastases than single CTCs, but the molecular mechanisms driving their formation are not fully understood. This study employed a computational ranking system, integrating proteomic data from breast tumors and cell lines with clinical survival data, to identify key proteins involved in this process. The analysis pinpointed Plexin-B2 (PLXNB2) as a top candidate associated with poor patient outcomes. In clinical samples, high PLXNB2 expression was enriched in CTC clusters and correlated with unfavorable overall survival (Hazard Ratio…

  • Dementia Prediction via Hierarchical Attention in Notes

    Original Title: Clinical Manifestations Journal: Alzheimer's & dementia : the journal of the Alzheimer's Association DOI: 10.1002/alz70857_102378 Overview The clinical interview is the primary diagnostic gateway for identifying dementia, serving as a screening phase to determine if a patient requires intensive neurological evaluation. While large language models excel in general text processing, their utility in analyzing unstructured medical records for cognitive assessment remains under-explored. This research evaluates a deep learning framework designed to predict Alzheimer’s disease solely from clinical notes. The study used a dataset of 1,387 clinical notes collected from medical centers in South Korea, including 542 Alzheimer’s cases and 845 normal controls. Notes were structured into ten categories…

Leave a Reply

Your email address will not be published. Required fields are marked *

CAPTCHA