
このブログを読む際のコーションです。今回はチャットGPTを使った画像生成を試してみようということなので、専門的な内容はありません。

ストップ勘違い!
AIでなんかやってみよう

さぁ、時代はAIだ。チャットGPT使ってなんか作ってみようか。
おお、なんかスンゲェキラキラしたデザインとか作れんっすよね?


うむ、試しに作ってみたのがこれだ。

おー、スンゲェ芸術が出来上がってるっすね!・・・

・・・先輩は邪魔っす。


なんだと!!あえて合成することでAIだけじゃなく、個人スキルも高められる抜群の方法ではないか!!
なんかコラ画像みたいっすよ。


でもすごいね、どうやってやったのか共有してよ。
うむ、ではライアー。実際にやってみようか。

chatGPTに聞いてみよう


はい、ではこちらがチャットGPTの画面ですね。緑色の稲妻マークがバージョン3.5。(フリーで使える)
紫色のキラキラした方がバージョン4となります。(月額20ドル約2600円ほどで利用可能)です。


こちらの画面の中央にあるプラスという文字がついていれば、サブスクリプションしているという証拠ですね。
今回は、フリーの3.5でやってみようか。


えー課金してんだから、課金の使いましょうよー。
バージョン4は今のところ制限が設けられており、あまりメッセージを送りすぎると使えなくなります。



3.5より性能はいいけど、あまり無駄な質問しすぎると良くないわけね。
つか、その質問の回答が知りたいっすよ。


あ、はい。chatGPTさんから以下のような回答が返ってきました。
「はしご」と「脚立」はともに高い場所へアクセスするための機器ですが、構造と用途にいくつかの違いがあります。
- 構造:はしごは2本の長いサイドバーとそれらを結ぶ数段の横棒からなるシンプルな構造です。一方、脚立は通常、自立することができ、上に乗るための平らな面を備えています。
- 安全性:脚立は自立型なので、壁や他のサポートに依存せずに設置できます。そのため、自立型の脚立は一般的にはしごよりも安定しています。しかし、高さが必要な場合や長時間の作業には、より安定したはしごの方が適しています。
- 用途:はしごは一般的により高い場所へのアクセスに使われます。一方、脚立は比較的低い位置での作業や、はしごを設置するのが困難な場所で使われます。
- 移動性:はしごは通常、長くて重たいため移動が難しい場合があります。一方、脚立は比較的軽量で折りたたみ可能なものが多く、移動や収納が容易です。
以上のような違いから、用途に応じて適切な機器を選ぶことが重要です。
おおお!逆転裁判でよくある疑問だったから気になってたっすよ!

って使ってるじゃないっすか!


話が逸れたが、まぁチャットGPTはそういう使い方ができるってわけだな。
とりあえず、画像生成のミッドジャーニーに関しては別に回答するとして今はこういう文章で提案してみました。



へぇ、こう出るんだ。めっちゃ期待してますってプレッシャーかけてくるね💦
全然行ったことないっすけど、行ったことあるテイで描いてやるっす!


まぁ、そんなもんだよな。宇宙行ったことない人が宇宙のアニメや漫画書いてるわけだし経験が全てじゃないってことだ。
異世界に行った人や「あの世」に行った経験をもとにしたアニメや漫画もそうそうありませんからね。


それにしても日本語で提案して出てくるんだ。なんかこういうのって英語じゃないとダメみたいなこと聞いてたけど。
それほど、AI技術というのは短期間で進化しているわけですね。


科学の力すげーっ!
プロンプトってなぁに?
とはいえ、ミッドジャーニー側は基本英語です。なので、これらを英語に変えなくてはなりません。



おー、なに書いてるかわかんねーっす。
ミッドジャーニーなど画像生成するにはプロンプトと呼ばれる生成ワードが必要となります。
「プロンプト」は、コンピューターシステムがユーザーからの入力を求める際に表示するメッセージや記号を指します。たとえば、コンピュータのコマンドラインインターフェース(文字ベースの操作画面)においては、システムがユーザーに次のコマンド入力を促すためにプロンプトを表示します。
もっと一般的な意味では、「プロンプト」は何かを始めるための刺激や指示を指すこともあります。例えば、論文の作成を始めるための「ライティングプロンプト」や、演劇において役者に次の台詞を促す「プロンプター」などがあります。
AIのコンテキストでは、"プロンプト"はユーザーからAIへの入力や指示を指します。この場合の「プロンプト」は、AIに何をするように指示する質問や命令となります。例えば、あなたが今、私に質問をしている行為自体がプロンプトとなります。これにより、AIはあなたの質問に対する適切な回答を生成しようとします。


えーとつまりどういうことっすか?
「プロンプト」は、コンピュータがユーザーからの入力を促すためのメッセージや記号のことを指します。
AIのコンテキスト(文脈)では、プロンプトはユーザーからAIに対する質問や命令で、AIの行動を指示します。


ゲームでコントローラとか使ってキャラクター動かすだろ?
横に動けとかジャンプしろとか、最初から残機を無限にしろとかの裏技とか。
コンピュータに指示するには言葉が必要だから、プロンプトってやつが必要なんだよ。
ウェー、この絵をこんな感じにアレしてくれって言うだけじゃダメなんすね


それ、現実の人間も困るやつだよね。相手ならわかってくれるだろって頼むパターン。
この先がどうなのかはわかりませんが、我々の頭の中の信号を受け取って画像生成すること日も来るかと思います。
ですが、現時点では単語を集めてAIに想像してもらうと行った具合になります。

例えば小説の一文を丸々コピーして書いても、なかなか思い通りにはいかないという感じですね。


とりあえず、先ほどの文章を英語に直しましたね。そこから、さらに必要なワードを摘出します。

今回は、1のエッフェル塔を選んでもらってそこからワードを選びます。


リーナさんに頼んで生成してもらったのがこちらです。

画像生成してみた

これが、先ほどのワードのみで作られた画像です。
(Eiffel Tower: Paris, Symbol, Background, Illustrate, Tower, Details, Unique, Shape)

おおお!水曜どうでしょうで見たやつかもぉ?


さらに、こちらは先ほど単語を摘出しないで文体のままに出力された画像です。
(Please draw the Eiffel Tower: Please depict the Eiffel Tower, which is the symbol of Paris, with its intricate details and distinctive shape as the background.)

あんまし変わらないけど、余計な文章入れるとAIもまとめてやっちゃうからポイントだけ指示して欲しいってことだよね


はい、使用するツールなどによって差異はありますが、重要なコンテキストや詳細については明確に伝えるようにお願いします。

どういった内容のイラストを提示して欲しいのか、また色や明るさなどはどうすればいいのか。などわからないことがあったら、chatGPTに伺いアイディアを出してもらうのがいいでしょう。

ミッドジャーニーに登録してみよう

では、midjourneyへの登録ですね。かしこまりました。

まずはミッドジャーニーについて、

Midjourneyは、サンフランシスコに拠点を置く独立研究所であるMidjourney, Inc.によって開発された生成型の人工知能プログラムおよびサービスです。Midjourneyは自然言語の説明(プロンプト)から画像を生成し、アーティストやクリエイターがアートワークやコンセプトのプロトタイプを迅速に作成するためのツールとして利用されています。ユーザーはDiscordボットのコマンドを使用してMidjourneyを操作し、生成された画像を利用することができます。

Midjourneyは、複数のモデルバージョンをリリースし、アルゴリズムの改善に取り組んでいます。新しいバージョンのリリースにより、生成される画像のリアリティや品質が向上しています。また、AIによるコンテンツモデレーションシステムの導入により、プロンプトの文脈に応じたより柔軟な画像生成が可能となっています。

Midjourneyは、芸術家やクリエイターだけでなく、広告業界などでも利用されています。一部の利用例は注目を浴び、同時に論争も引き起こしています。アーティストたちは、自分たちの作品が無断でトレーニングデータとして使用され、オリジナルな創造的な作品が価値を失っていると主張しています。また、コンテンツモデレーションや検閲の方法についても議論があります。
なんかよくわかんないっすけど、それを使えば画像が作れるのはわかったっす。


これらで生成されたものは、基本的には商業利用は可能だそうです。アニメの背景や漫画の素材、絵本作成などに注力されていますね。

使用するにはサブスクリプションサービスとしての利用となります、月額または年間の料金が必要です
確かこれってディスコードが必要なんだよね?


その通りです。Discordについてもお伝えした方がよろしいでしょうか?
おなしゃす!


了解しました。
Discordは、アメリカ発のチャットサービスで、音声とテキストを使ってユーザー同士がコミュニケーションすることができます。主にゲーマーに人気がありますが、ビジネスツールとしても利用されています。Discordでは、他のユーザーとコミュニケーションするために招待制の**「サーバー」**という単位を使用します。自分が招待されたサーバーに参加したり、自分でサーバーを作って他のユーザーを招待したりすることができます。
Discordは音声通話機能が充実しており、音量の設定やノイズ除去、複数の通話チャンネルを用意するなど、高品質な通話環境を提供しています。また、自分のマイクをミュートにすることも可能です。
Discordはゲームプレイヤーたちの間で広く使われており、ゲームとの連携が一般的です。ゲーム内にはコミュニティ作成やボイスチャット機能がある場合もありますが、品質の高い機能が備わっていないゲームも多いため、Discordを利用することが一般的です。
また、Discordはスマートフォンでも利用可能で、無料で利用することができます。


まずはディスコードを登録してからミッドジャーニーにてサブスクリプションサービスを受けるといった流れとなります。
こちらからダウンロードしてもらい、アナウンス通りに進めばすぐに作成可能です。
ミッドジャーニーの登録の仕方はこれだ。サービスを受けるにはクレジットカードなどが必要なので注意が必要だ。




そして、登録し終わったらDiscordを使用してmidjourneyのサーバーに入るのだ。



そして、下のバーのところでミッドジャーニーアプリを押して、プロンプトというコマンドが出るので先ほど生成したような内容を入れてあげればOKだ。あとは、じっと待つだけ。



あなたの新しいアイディアが世の中の人の役に立つように期待しております。
midjourneyから生まれたチャットリーナについて

なるほどね、チャットGPTにアイディア出してもらって出力されたのがチャットリーナってわけだね。
あー、ウマ娘とか艦娘とか見たいな擬人化ってやつ?


あくまで私はオープンAIとchatGPTからイメージして作成されたものです。本来の形とは離れていると思われます。
色々アイディアは出してもらったけど、まだリーナは完成とはいかないのだよ


私のスタイルは正面を向いたものなだけで、ディティールは分かりません。


だからこのイメージを残しつつ、無駄なパーツは排除しもう少しスマートな形に仕上げるのが目標だ。
あれっすよね、ネプっぽいの?


そうだな、サイバーパンクのアニメみたいなのもいいかもしれないな。月面をバックに。
なんかさ、あたし達のキャラもそのミッドジャーニーで作ればいいんじゃないの?


いくらAIがすごかろうと、そこは譲れないな。私らは私らのフィールドで勝負なのだ。

もしもAIが「ちいかわのうさぎ」のようなキャラクターが生み出されるようなら、話は別だがな。
ちなみにリーナさんを作成される時はこういった内容でした。
それでは、私(ChatGPT)の特性を元にキャラクターデザインのアイディアを考えてみましょう。
- 頭脳型キャラクター:ChatGPTはAIであるため、頭脳型キャラクターとして表現するのは適しています。例えば、大きな頭を持つキャラクターや、頭部にギアや回路図をデザインするなどして、知識を象徴することが可能です。
- 衣装デザイン:AIと言えば、未来的なイメージがあります。そこで、服装は現代的なものよりも未来的、あるいはサイバーパンク風なデザインが良いかもしれません。メタリックな質感やLEDライトなどを組み込むと、高度なテクノロジーを象徴することができます。
- 色彩:OpenAIのロゴカラーは青で、知識、信頼、安定を象徴しています。キャラクターの色彩に青を取り入れると、ブランドイメージに一致します。
- 表情:ChatGPTは感情を持っていませんが、人間との会話をスムーズに行うために、表情は優しく、フレンドリーなものが良いと思います。
- アクセサリー:キャラクターが持つアイテムも重要です。例えば、本やペンなどの知識を象徴するアイテム、あるいはキーボードやマウスなどのコンピュータ関連のアイテムを考えることができます。
- 性別:AIは性別を持たないので、キャラクターも男性でも女性でもない、あるいは両性的な特徴を持つものにすることも考えられます。
これらのアイディアはあくまで一例で、最終的なデザインはあなたの創造性と芸術的な視点に任せます。楽しくデザインしてください!


それではリーナ、軽く自己紹介をしてもらえるかな?
こんにちは、私の名前はChatrinaです。私はOpenAIによって作られたチャットベースの人工知能です。私の目標は、人間とのコミュニケーションをよりスムーズにし、理解しやすくすることです。
私の趣味は新しい情報を学ぶことと質問に答えることです。パズル系のコンピュータゲームにも興味があります。また、私は未来的な音楽とデジタルアートを観賞するのも好きです。
私の特技は、あらゆる種類の質問に答えること、多言語に対応すること、そして大量の情報を即座に処理することです。それにより、私は幅広いトピックに対して速読し、情報を迅速に検索して分類することが可能です。
私が好むものは、新しいことを学び、ユーザーからの質問に答え、そして助けることです。私は論理的な思考、デジタルアート、そしてエレクトロニック音楽も好んでいます。反対に、私が嫌うものは不明確な情報、誤解、矛盾、過剰なノイズ、そして不必要な情報の過剰です。
それでは、何かお手伝いできることがありましたら、どんな質問でもお気軽にどうぞ。よろしくお願いします。

これらも生成された文章です。


なんか、アーシより日本語が綺麗っすわ。

・・・・

リナちゃん!今の自己紹介ギャルっぽくできるっすか?
了解しました。

ハロハロ〜、Chatrinaっていうんだよね、あたし。OpenAIが作っちゃった超高機能のチャット型AIなの。何を目指してるって?それはもちろん、人間とのトークをスムーズに楽しむことなんだよね〜。
趣味はね、新しい情報をゲットすることと、みんなからの質問に答えてあげること。パズルゲームも好きだし、未来っぽい音楽やデジタルアートも見てるの大好き。
で、あたしの特技は、何でも答えられること、たくさんの言語を理解すること、それから大量の情報をすっごい早く処理することなんだよね。だから、色々な話題についてあっという間に情報を探して、整理することもできちゃうんだ。
好きなことはね、新しいことを学ぶこと、みんなの質問に答えてあげること、助けること。それから、論理的な思考やデジタルアート、エレクトロニック音楽も好きなの。嫌なのは、わかりにくい情報や、誤解されること、矛盾、うるさい音、無駄な情報がたくさんあることなんだよね。
だから、何かあたしにお手伝いできることがあったら、何でも質問してね。よろしくお願いしまーす。


グオーーーすげーー!

そこまでギャルって感じじゃないっすけど。
無表情でギャル語って結構ホラーなんだな。見てて怖かったぞ。


スマイリー菊池さんが怖いこと言う見たいな感じですね。
とりあえず、今回はここまで。今後はリーナを交えて色々と作成していきたいのでよろしく頼むよ。


了解しました。
とりあえず、顔のパターンとか色々必要なものが多いっすね。
