Descript 字幕 vs yt-captions: 日本語精度・速度・料金で比較
Descript の AI 字幕は英語に最適化されています。日本語動画で同等の精度を求めるなら、Whisper-WebGPU (OpenAI) を直接利用する yt-captions が選択肢。月額課金とクラウド送信を回避して、字幕生成→焼付までブラウザで完結します。
処理速度の比較
JobDoneBot 字幕生成 + 焼付180000ms
⚡
Descript240000ms
JobDoneBotは約1倍高速·アップロード待ち時間ゼロ
機能・スペック比較
| 項目 | JobDoneBot | Descript |
|---|---|---|
| ファイル処理方式 | ✓ブラウザ内 (Whisper-WebGPU) | クラウド (US) |
| プライバシー | ✓送信ゼロ | クラウド送信 |
| 日本語精度 (WER) | ✓~8% | 英語最適化、日本語は劣後 |
| 料金 | ✓完全無料 | 月 $24〜 |
| 字幕焼付スタイル | 3 スタイル + ASS 手動指定 | 汎用テンプレ |
| 手動 SRT モード | 対応 (既存字幕の焼付) | 対応 |
| モデルサイズ | tiny ~74MB / small ~244MB 選択可 | 非公開 |
| オフライン利用 | ✓可 (初回 DL 後) | 不可 (常時クラウド) |
結論
日本語動画で字幕を作るなら yt-captions が圧倒的優位。Whisper-WebGPU の日本語精度は同価格帯のクラウド SaaS を上回る。Descript はテキストベース編集が主軸で、字幕は副機能。
JobDoneBotを選ぶ理由
- 1Whisper の日本語 WER 8% を月 $0 で利用
- 2クラウド送信なしで未公開素材も安全
- 3初回モデル DL 後はオフラインでも動作
Descriptを選ぶべきケース
Descript のテキストベース動画編集 UI が必要なクリエイター、英語コンテンツ中心のチャンネルに有利。
JobDoneBot 字幕生成 + 焼付 を無料で使う →
登録不要・アップロードなし・完全無料
よくある質問
日本語の精度は本当に WER 8% ですか?▼
Whisper の small モデルで一般的な解説動画を測定した値です。雑音が多い環境や方言が強い場合は劣化します。手動 SRT モードで補正可能。
モデルサイズは選べますか?▼
tiny (~74MB)、base (~142MB)、small (~244MB) から選択可。tiny は速いが精度が劣り、small は精度が高いが時間がかかります。日本語なら base 推奨。
Descript と比べて何が劣りますか?▼
テキストベース編集 (発話を文字単位で削除/並べ替え) は Descript が圧倒的に強い。字幕『生成』機能だけなら yt-captions で十分。
無料ですか?▼
完全無料・無制限。Whisper モデルは初回のみブラウザにダウンロードされ、IndexedDB にキャッシュされます。