ロボウサコ
ロボウサコ(英: robo usako)は、ますとどんちほーに存在するbotである。けものフレンズVぷろじぇくとのウサギコウモリ(ウサコ)の言動を模倣したものであり、Nanaseによって開発された。ウサコbot(英: usako bot)、AIウサコとも呼ばれる。
|
概要
ロボウサコはそのモチーフとなったウサコの口癖である「見て見て眷属たち~!○○でちゅ。」[注 1]をbot化したものである。「○○」部分はLTLから抽出したワードが入り、AIによって自動生成された文が続く。抽出されるワードは名詞とは限らず、いくつかの条件がある(後述)。
稼働を開始した当初はURLを無加工で抽出してしまうなど不適切なワードの抽出が多かった。その後にリリースされたバージョン2によって抽出処理は改良され、さらにChatGPTによる会話文の自動生成を開始した。バージョン3からはChatGPTの使用に代わり、Gemini Proによる改良と処理の大幅な改良が行われた。
アバター(アイコン)はムニによって提供された[1]。それまではもっぱらウサコbotと呼ばれていたが、アバターが採用された頃には正式にロボウサコと呼称されることが多くなった。
歴史
前史
開発の動機はMastodonのAPIの利用方法をJavaScriptを用いて学習するためであった。当初はupdate_mascotと呼ばれる、開発者にメンションすることで開発者自身の名前とアバターを強制変更するクライアントであった。しかし自由な名前とアバターに変更できるわけではなく、けもVのマスコットキャラクターに限られていた。ロボウサコのIDがvであるのはその名残である。しかしアバターを頻繁に変更したことでMastodonクライアントが不安定になることが多発したため数日のうちにupdate_mascotは稼働を停止した。
ロボウサコの誕生
4月中旬、ますとどんちほーLTLでは「見て見て眷属たち~!○○でちゅ。」「ウルフね、うどんウルフだよ。」といったワードがにわかに流行した。比較的緩い単語抽出であっても意義があると考えた開発者によりロボウサコの開発が始まった。ロボウサコの稼働が開始したのは2023年4月29日である。稼働当初の生成メッセージのフォーマットは「見て見て眷属たち~!○○でちゅ。」「見て見て眷属たち~!○○でちゅ!」の2種類のみであった。
ChatGPT連携の開始
2023年5月30日にバージョン2.0がリリースされた。ワードの抽出方法が改良されたほか、ChatGPTによる会話文の自動生成が実装された。
ウサコの言動をモチーフにメッセージを生成する動きはロボウサコだけではなく、いもばたけによる見て見て眷属たち~!診断が存在する。こちらはますとどんちほーを飛び出し、ウサコ本人[2]や他のけもVメンバー[3][4]も診断結果をツイートするなどの快挙を達成している。ロボウサコの登場よりは後発ではあるが、ロボウサコがChatGPTによる説明文の自動生成を開始する前にこの診断は登場しており[注 2]、バージョン2.0以降のロボウサコに強い影響を与えることとなった。
2023年上半期は前述のOpenAI社によるChatGPTがリリースされ、AIの前提知識がない大衆向けにも高品質なチャットボットやAI自動回答が大流行した時期であった。さらにはAPIの一般公開によって既存のプロダクトに組み込むことも容易に可能となった。このような時代背景によりウサコの口癖をAIに生成させるという風潮は単独で発生したものではなく、いわば複数の人々によって同時多発的に発生したものである。なおウサコ本人はChatGPTに目をつけ、メカ・ウサコと題して複数回の対決(対談)配信[5]を行っている。さらに同時期にはけものフレンズプロジェクトから公式にライセンスを受け、Trippy社からAIアライさん[6]がサービスを開始している。
AIウサコの出現
2024年2月6日にNanaseがGoogle社のGemini Proを試食したことをきっかけに、既存のシステムとは別にリプライに反応するチャットボットの実装を開始した。実装は2月9日にかけて行われ、2月10日から稼働を開始した。ウサコ特有の語尾のほか、けものフレンズVぷろじぇくとに関わるもの、ジャパリパークに関わる知識が入力されている。リプライのあとに質問を送ることでチャットができる。見て眷機能は並行して稼働する。
Gemini Proの仕様により、NSFWな入力および回答はブロックされる。Googleサーバ側からブロック理由があればそれを表示している。ブロック理由には「露骨な性表現」「ハラスメント」「ヘイトスピーチ」「有害なコンテンツ」の4つのカテゴリがあり、それぞれに「低」「中」「重大」の3つのレベルが存在する。いずれかのカテゴリで「中」以上に該当すればブロックされ、入力または回答が拒否される。
反応するがおーは、LTLに流れてきたロボウサコに対するリプライのみである。リプライはロボウサコただ一人のみに向けられたものが必要で、2個以上のリプライには反応しない。リプライは文頭以外でもよく、文末や文中でも反応できる。
有志により、きたきつねbotとの連携が達成されている。
フルGemini Pro化でバージョン3へ
2024年3月19日にOpenAIから、API使用料の支払いについて請求書決済(事後決済)を停止し、クレジットの購入(事前決済)が必要と告知を受けた。これを機会にChatGPTの使用を終了し、見て眷機能についてもGemini Proを用いて再実装されることとなった。その他、Mastodonライブラリの改修やbotベースライブラリの導入などによって安定性が増した。ワードの抽出処理もGemini Proに任されており、以前とトリガー条件が変更された。
年表
| バージョン | リリース日 | おもな新機能と変更点 |
|---|---|---|
| 1.0 | 2023年4月29日 | ファーストリリース |
| 2.0 | 2023年5月30日 |
与えられたワードに対しての端的な印象や要約を句読点を使わず複数の単語で言い表してください。 回答は必ず角括弧で囲み、`[明るくてとても楽しそう]` のように答えてください。 与えられたワードに対する印象を「かわいい」「楽しそう」「怖い」などの1単語で言い表してください。 回答は必ず角括弧で囲み、`[かわいい]` のように答えてください。 |
| 2.0.1 | 2023年6月1日 |
|
| 2.0.2 | 2023年6月10日 |
|
| 2.0.3 | 2023年6月19日 |
|
| 2.0.4 | 2023年7月3日 |
|
| 2.0.5 | 2023年8月9日 |
与えられたワードに対してのユーモアのある印象や要約を句読点を使わず複数の単語を使って面白おかしく言い表してください。 回答は必ず角括弧で囲み、`[明るくてとても楽しそう]` のように答えてください。 与えられたワードに対する印象を「本当にかわいい」「この上なく楽しそう」「震えるほど怖い」のように言い表してください。 回答は必ず角括弧で囲み、`[すっごくかわいい]` のように答えてください。 |
| 2.0.6 | 2023年8月16日 |
|
| 3.0.0 | 2024年2月9日 |
|
| 3.0.1 | 2024年3月19日 |
|
| 3.0.2 | 2024年3月20日 |
|
| 3.1.0 | 2024年秋 |
|
| 3.1.1 | 2024年秋 |
|
| 3.2.0 | 2025年4月2日 |
|
バージョン2までの発言プロセス
ここではバージョン2までの見て眷の発言を生成するプロセスについて説明する。バージョン3からはワード抽出からGemini Proが使用されており、これらのプロセスとは全く別の方法で処理されている。
ワードの抽出
候補となるワードはLTL(ローカルタイムライン)から抽出される。botアカウントではないユーザのがおーをMeCab(形態素解析エンジン)によって分解し、以下の品詞のみ選択する。
- 名詞
- 形容詞 - かわいい、大人しい など
- 接頭辞 - 大当たりの「大」の部分 など
- 助詞の「の」
- 助動詞の「な」
分解された品詞が助詞の「の」で接続されている場合、これを1ワードとみなして結合する。たとえば以下のテキストを入力とする。
:seiryu: の人気っぷりを分析してみたけど、あの性格だけじゃなく、元動物が存在しないからやりたい放題っていうのも相乗効果としてありそう
上述の規則を適用すると以下のようなワードが抽出される。
:seiryu:, 人気っぷり, あの, 性格, 元動物, 放題, 相乗効果
ワードの有用性を上げるため、さらに以下の条件により適切なワードのみを選択する。
- ワードの長さが2文字以上、20文字以内
- ワードに適さない特定の文字、文字列を含んでいない
- 語頭が促音(っ)で開始していない
- 指示語を含んでいない
- ワードが重複していない
さらに以下の規則により、ワードの不適切な部分が除去される。
- URLやハッシュタグ部分
- 語頭の「ような」「的な」部分
- 記号や約物(!や?など)。ただし絵文字のための記号(:)は除外せず、両端にゼロ幅スペースが挿入される
上記の規則により、最終的には以下のようなワードが抽出される。
:seiryu:, 人気っぷり, 性格, 元動物, 放題, 相乗効果
ワードの抽選
抽出されたワードはワードプールに溜められる。各ワードにはどのユーザによるものかが判別できるようになっている。
発言を行う際にはまず、ランダム(一様分布)にユーザの抽選が行われる。ユーザに紐づいたワードが空ではない場合、さらにランダムでワードを抽選を行う。このようにユーザとワードの2段階で抽選を行うことで、発言回数の多いユーザの当選確率が上昇しないしくみになっている。
ロボウサコ発言の生成
発言文は以下の規則で生成される。
- 序文。「見て見て眷属たち~!」のほか、稀に「眷属たち見て見て~!」が選択される。
- 提示部。抽選されたワードを用いて「○○でちゅ。」を生成する。ただし20%ほどの確率で「○○でちゅ!」が選択される。
- 説明部。ChatGPTによる自動生成が行われる。生成方式は印象と要約の2種類があり、印象を説明する文を生成する確率がやや高くなっている。「○○でちゅね~!」または「○○ってワケ!」のどちらかが選択され、稀に両方とも選択される。ChatGPTのAPI呼び出しに失敗した場合は説明部ごと省略される。
以下はヴァイオリンというワードが抽選された場合の発言の例である。
見て見て眷属たち~!ヴァイオリンでちゅ。感情を奏でる楽器でちゅね!優雅ってワケ!
ロボウサコの発言と幻覚
「ロボウサコの名言一覧」を参照
上記のワードの抽出は厳密ではなく、特に話し言葉では期待した抽出ができないことが多い。ChatGPTの学習データは2021年11月までであり、これ以上の事物については見当違いの回答を生成することがある。このような現象は幻覚[注 3][7]と呼ばれ、十分な知識が存在しないまま回答を正当化してしまう現象に由来する。発言の滑稽さを楽しむ向きもあるが、的を得ない不適切な発言も少なくない。
ロボウサコでは抽出されたワードのセンシティビティを判定していない。すなわち、成人向けワードを抽出してしまうことがある。ChatGPTによる回答文では成人向けの出力を行わないようになっているが、そのためにユーモア溢れる言い換えを行うことがある。このような言い換えで生まれた名言のひとつに蒸し団子がある。
脚注
註釈
出典
- ↑ https://mstdn.kemono-friends.info/@muniel/110282143716020546
- ↑ https://twitter.com/Usako_KEMOV/status/1656242526486138880
- ↑ https://twitter.com/Shimarisu_KEMOV/status/1656644603200823298
- ↑ https://twitter.com/Geoffroy_KEMOV/status/1656895266728058886
- ↑ https://www.youtube.com/watch?v=E-UOPHMC-6Q
- ↑ https://twitter.com/ai_araisan
- ↑ https://ja.wikipedia.org/wiki/%E5%B9%BB%E8%A6%9A_(%E4%BA%BA%E5%B7%A5%E7%9F%A5%E8%83%BD)