AudioCraft

音楽・効果音・音声圧縮をひとつに — Meta発のオープンソース音声生成フレームワーク

AudioCraft の基本情報

開発元 Meta
カテゴリ 音声・オーディオ / 音楽制作 / リサーチ・論文
料金 unknown
対応プラットフォーム web

AudioCraft の詳細

AudioCraftは、Meta(旧Facebook)が開発したオープンソースの生成AI音声フレームワークです。音楽生成・効果音生成・音声圧縮という3つの機能を単一のコードベースに統合しており、生の音声信号を学習データとして扱うことができます。主要モデルとして、テキストプロンプトから音楽を生成する「MusicGen」、テキストや音声から効果音を生成する「AudioGen」、そして高品質な音声圧縮を実現する「EnCodec」が含まれています。機械学習エンジニア、音楽制作に取り組む開発者、音声AI研究者など、コードベースで音声生成を扱いたい技術者向けのツールです。ゲームや映像制作向けのBGM・効果音をAIで自動生成したい場合や、音声モデルの研究・実験をスクラッチから行いたい場合に特に有効です。PythonおよびPyTorchベースで動作し、GitHubからダウンロードして自分の環境で自由に利用・カスタマイズできます。

主な機能

テキストプロンプトからの音楽生成 (MusicGen) / テキスト・音声入力からの効果音生成 (AudioGen) / 高品質ニューラル音声圧縮 (EnCodec) / 生の音声信号を学習データとした事前学習モデルの提供 / 単一コードベースによる音楽・効果音・圧縮の統合管理 / PyTorchベースのオープンソース実装 / カスタムデータセットでのファインチューニング対応