Build a Large Language Model (From Scratch)

ゼロから学ぶ大規模言語モデル構築 — アテンション機構からGPT型トランスフォーマーまで実装で理解する

Build a Large Language Model (From Scratch) の基本情報

開発元 Manning Publications
カテゴリ コーディング / 教育・学習 / LLM・基盤モデル
料金 paid
API提供 あり
対応プラットフォーム ios, linux

Build a Large Language Model (From Scratch) の詳細

「Build a Large Language Model (From Scratch)」は、Manning Publications が提供するLLM(大規模言語モデル)の仕組みを実装しながら体系的に学べる技術書です。アテンション機構の実装方法からGPTスタイルのトランスフォーマーモデル構築まで、コードを書きながらステップバイステップで理解を深められる構成となっています。

AIエンジニア・機械学習エンジニア・研究者・深層学習を本格的に学びたいソフトウェア開発者を主な対象としており、「LLMの内部構造を正確に把握したい」「ブラックボックスとしてではなく原理から理解したい」という方に特に向いています。

既存のAPIやフレームワークを使うだけでなく、自分でモデルをスクラッチ実装してみたい時、またはトランスフォーマーやアテンション機構の論文・コードを深く理解したい時に最適な一冊です。理論と実装の両面からLLMを習得できるため、AI開発の基礎力を根本から強化したいエンジニアに適しています。

主な機能

アテンション機構のゼロからの実装解説 / GPTスタイルのトランスフォーマー構築 / LLMの学習・事前学習プロセスの実装 / トークナイザーの仕組みと実装 / モデルのファインチューニング手法 / 実践的なPythonコードによるハンズオン形式 / LLMアーキテクチャの理論と実装の対応づけ