【完全無料】オープンソースLLMをGoogle Colabでファインチューニングして「おてんば姫」を作った話
Google Colabの無料GPUを使い、QLoRA × Unslothで独自キャラクターAIを作成した技術解説です
LLMファインチューニングGoogle ColabQLoRAUnsloth
はじめに
Google Colabの無料枠(T4 GPU)を活用し、オープンソースのLLM(大規模言語モデル)をファインチューニングして、独自のキャラクター性を持つAI「おてんば姫」を作成しました。
本記事の詳細は Qiitaの記事 をご覧ください。
技術スタック
| 項目 | 内容 |
|---|---|
| 実行環境 | Google Colab(無料枠・T4 GPU) |
| ベースモデル | Qwen2.5-1.5B-Instruct |
| 学習手法 | QLoRA × Unsloth |
| 学習データ | 101件のJSONL形式データ |
| 学習時間 | 約50秒 |
| 費用 | 完全無料 |
概要
LLMのファインチューニングとは、事前学習済みのモデルに追加の学習データを与えて、特定のタスクやスタイルに適応させる手法です。今回は一人称「余」、語尾「〜のじゃ」というキャラクター性を持つ「おてんば姫」を作成しました。
ポイント
- LLMはパターンを学習する: 会話データに含まれるパターンを統計的に学習させることで、自然なキャラクター口調を再現
- QLoRA × Unslothによる効率的な学習: メモリ効率の良いQLoRAとUnslothの組み合わせにより、無料GPUでもファインチューニングが可能
- 少量データでの実現: わずか101件のデータで十分なキャラクター性を実現
学習前後の比較
学習前: 標準的なAIアシスタントとしての回答 学習後: 「最高に晴れているのじゃ!」など、キャラクターの口調が自然に再現