はじめに

Google Colabの無料枠（T4 GPU）を活用し、オープンソースのLLM（大規模言語モデル）をファインチューニングして、独自のキャラクター性を持つAI「おてんば姫」を作成しました。

本記事の詳細は Qiitaの記事をご覧ください。

技術スタック

LLMのファインチューニングとは、事前学習済みのモデルに追加の学習データを与えて、特定のタスクやスタイルに適応させる手法です。今回は一人称「余」、語尾「〜のじゃ」というキャラクター性を持つ「おてんば姫」を作成しました。

LLMはパターンを学習する: 会話データに含まれるパターンを統計的に学習させることで、自然なキャラクター口調を再現
QLoRA × Unslothによる効率的な学習: メモリ効率の良いQLoRAとUnslothの組み合わせにより、無料GPUでもファインチューニングが可能
少量データでの実現: わずか101件のデータで十分なキャラクター性を実現

学習前: 標準的なAIアシスタントとしての回答 学習後: 「最高に晴れているのじゃ！」など、キャラクターの口調が自然に再現