Antoine Déchappe - Training

Antoine Déchappe

Latest research review

Layer Normalization
Jul 20, 2025

Recent writing

Mocking UUIDs in Python Tests with a Generator
Jul 28, 2025
Beware of poetry package named differently from project structure
Mar 27, 2025
Pre-commit options in pyproject.toml should be committed first
Mar 12, 2025

Antoine Déchappe

Research review

❯

Research review

❯

❯

- Research review
  - LLMs
    Training
    Branch-Train-Merge: embarrassingly parallel training of expert Language Models
    Smaller, weaker, yet better: training LLM reasoners via compute-optimal sampling

GitHub
LinkedIn
Email