記事一覧に戻る

【完全無料】オープンソースLLMをGoogle Colabでファインチューニングして「おてんば姫」を作った話

Google Colabの無料GPUを使い、QLoRA × Unslothで独自キャラクターAIを作成した技術解説です

LLMファインチューニングGoogle ColabQLoRAUnsloth

はじめに

Google Colabの無料枠(T4 GPU)を活用し、オープンソースのLLM(大規模言語モデル)をファインチューニングして、独自のキャラクター性を持つAI「おてんば姫」を作成しました。

本記事の詳細は Qiitaの記事 をご覧ください。

技術スタック

項目内容
実行環境Google Colab(無料枠・T4 GPU)
ベースモデルQwen2.5-1.5B-Instruct
学習手法QLoRA × Unsloth
学習データ101件のJSONL形式データ
学習時間約50秒
費用完全無料

概要

LLMのファインチューニングとは、事前学習済みのモデルに追加の学習データを与えて、特定のタスクやスタイルに適応させる手法です。今回は一人称「余」、語尾「〜のじゃ」というキャラクター性を持つ「おてんば姫」を作成しました。

ポイント

  • LLMはパターンを学習する: 会話データに含まれるパターンを統計的に学習させることで、自然なキャラクター口調を再現
  • QLoRA × Unslothによる効率的な学習: メモリ効率の良いQLoRAとUnslothの組み合わせにより、無料GPUでもファインチューニングが可能
  • 少量データでの実現: わずか101件のデータで十分なキャラクター性を実現

学習前後の比較

学習前: 標準的なAIアシスタントとしての回答 学習後: 「最高に晴れているのじゃ!」など、キャラクターの口調が自然に再現

motokifujino.com

This site is made by motoki fujino, Icons by Lucide.