はやりの生成AIの使用で分かってきたことと、今のところのどう使えばいいかを自分なりに考えて書いてみた備忘録的記事

(今週の一枚)街歩き(CG集用なんだけどエロがない)
前回は全体的な方向性・概念の価値について考えた。今回は、実用的・現実的にわかってきたことから使用の方向性を探ってみた感じです。
生成AIの使用と問題
今、流行りの生成AIはLLM(Large Language Model 大規模言語モデル)と言われるシステムだ。これは大量のデータ(文字情報に紐づいたデータ)を場合分けして統計的な処理をする。同時に抽出情報の組み合わせや平均化をすることであたかもそれらしい情報を出力するものだと思う。利点は早く確からしい計算結果にアクセスできる点だ。
元データが多ければ多いほど、それを慣らすことができればそれらしい文章や画像を出力することができ、今まで不可能と言われていたことができるようになってきたので、盛んに投資がなされて人間社会の前提を覆す技術の分水嶺になるのではないかと言われている。しかし、実際に使ってみると、単純な誤りや明らかな嘘をついたりすることがあり、いかにしてこのハルシネーションを抑えるかが大きなテーマになってきた。
また、LLMは推論ができるというのが大きな売りだ。好意的に言い換えると、AIが自分で考えて人間がわからない事象に対して別のアプローチから新たな可能性を導くことができ、しかも大量の計算機を繋ぐことで人間の何千倍ものスピードで思考できるそうだ。しかし、実際にはポチョムキム理解に示されるように、思考を必要とする問いにはあてずっぽうで処理されていることがわかり、我々が理解できないAIの評価や処理は当初言われていたほどちゃんとしたものではないことがわかってきた。
そのため、多くの企業でデータを読ませてローカル環境で経営判断するとか、新しい創作や我々が処理できない数学的な問題など未知の事象への利用は役に立たない可能性が高くなってきた。画像や動画を出力する場合でも、丸投げでは整合性の取れないおかしなものが出るので、しっかり管理しないといけない。
つまり、現状で我々が利用できるものはちょっと高度なグーグル検索や、答えが決まっていることや繰り返し行う作業の効率化・作業の補助が主となりつつある。
生成AIによって起こったこと
この技術を使えばだれでもある程度の文章や絵を得ることができる。しかも、とても短い時間でテンプレートを得られる。例えば、大学の学生がレポートを作ったり、プレゼンテーションを組む時には本当に楽だろう。ビジネスパーソンがメールの応答や会議の議事録を作るにはとても役に立つ。
これによって事務作業が効率化し、他の仕事に時間を割くことができるようになるだろう。では、実際に生成AIを使うことで我々の社会に何が起こってきているかを観察すると、「平均化」ではないかと思う。生成AIが先進的に使われるのは大学だろう。大学で働いている同期の話を聞くと、学生全体の質は良くなったが、やはり悪くなったという。何言ってんだこいつ?と思ったが、話をよく聞くとそれなりに納得できた。少子高齢化が原因なのか、国立大学でさえ学生の質は徐々に落ちてきている。そのため、出来の悪い学生の学力管理が大学の重荷になってきたが、ここ数年は改善しているそうだ。これは生成AIを使った学習や発表方法を行うことによってなされているが、学力の低い学生にはかなり効果があるようだ。一方で、学力の高い学生にはあまり良い効果がない。彼らも生成AIの出す「正しい答え」を自然と選択するため、独創的な発想や自分なりの答えを出す能力が落ちているみたいだ。表面的に出来の悪い学生の学力が伸びているが、実は補助器具の力でかさ増しされている可能性もある。つまり、馬鹿なやつも頭のいいやつも減って平均的な学生が増え、生成AI依存になり学生の質そのものが変容して本来の学力は下がっているという認識になるみたいだ。
おそらく、これは生成AIを生活に取り入れるならすべての人に当てはまる現象だろう。「強力な補助器具」があるのだから、便利になるがその機能そのものは使わないので弱体化する。脳みそも筋肉も同じである程度ストレスをかけて鍛えないと維持できないということだろう。
絵描きや漫画家は生成AIをどう使うべきか
人間は社会性をもってお互いを補完しながら生きている。さらに、道具を使って自分の足りない部分を補ったり強化して生活の質を改善している。人間単独では弱い。
絵や漫画を描く点においても同じことが言えるだろう。作画者と原作者が別なことも多いし、漫画なら編集者がいて、アシスタントが作者を手伝う。作家も筆を鉛筆に変え、ペンタブを握るようになり、目で見た風景から写真を参照するようになり、過去の作品を参考にして新しい作品のネタを生み出すようになってきた。
生成AIも同じような道具なので、当然、使うべきだ。そして、どう使うべきかを考えると、「足りないところを補う」ことが有力な使用候補になると思う。例えば、漫画を描く場合、ストーリーと作画、コマ割りなど様々な要素がある。ある漫画家は絵を描くのがとても得意だが、ストーリーがポンコツで、コマ割りが雑だとすれば漫画は評価されないなんてことはざらだ。
ここで生成AIだ。それを補うためにストーリーの種を生成AIに与えて平均的な物語を作ってもらい、それを元に自分なりの物語を肉付けすればいい。つまらない物語が最低限普通の物語になる。それを再度生成AIに与えて添削などをして粗削りな点を整え、さらに自分なりの表現を追加して物語を作り出すなんてこともできれば、ちょっと面白いストーリーを作ることができる。
大切な点は上の学生の例で書いたように、生成AIが出す答えは至極平均的で当たり前の答えを出すということだ。生成AIが出した答えをそのまま出せばごく平凡な物語になるだろうが、一方で、人の目には見やすいもの・共感しやすい物になる。この特性を使うことで製作の効率化を図るのだ。なぜそんなことを勧めるかと言うと、なんでも0から物を作るのは大変だからだ。1から10に肉付けするのは意外と楽に作れる。アレンジ、二次創作などもそういった容易さを利用している側面もある。オリジナリティは減るが、自分に明らかに不足しているものを理解しているなら、生成AIで補うべきだと思う。
著作権と生成AIの限界
絵描きが絵を生成AIでひねり出すのも一つの手だと思う。次回以降の記事にStable Diffusionなどの具体的なソフトについて書こうと思うが、今回はとりあえず著作権を中心に書く。
色々と調べて理解したけど、著作権と著作人格権を明確に規定して法律的、道徳的にはっきりと線引きするのは日本では不可能だ。だから、お行儀の良いことを書けば、生成AIを使うべきではない。拡散モデルは大量の画像データのドット位置情報・分散の度合いから絵や写真を再構成しているので、どこまでが著作権がカバーするか定義がない。法もグレー、手法もグレーだから、グレーと言うことは使っても自己責任でどうぞやってくださいとも言える。
一方で、大手の有名絵描きや漫画家は平気な顔して写真をトレースしたり他人の作画をパクったりして、定期的に大炎上しているが、裏を返せばある程度みんなやっているということだ。
普通に考えればほぼ丸パクリの作品が出ている江口氏の場合も、法律的には黒に近いがグレーだそうだ。まぁ、ネットリンチの標的に会って仕事を失いそうだという点から見るとアウトなんだろう。
こういうのはいくつもある。例えば、スラムダンクはトレースしまくりだったし、漫画ウシジマくんなんて、後半は同じコマの使い回しや写真のフォトバッシュ、他の作画と明らかに違うどこかで見たような俯瞰の立ち絵構図が使われているがなにも言われない。なんだかんだで、一から作っているのは鳥山明くらいでほぼすべての人が何らかのパクリをしている。
つまり、グレーの部分をうまく理解して使えばいいというのが商業誌では当たり前であり、それができないと商業的に量産できないのだろう。
では、この理屈を元に、生成AIを何でもかんでもバンバン使えばいいかと言うとそうではない。小物やぼやけた背景を使う分にはOKだろうし、入力データをすべて公開物から引っ張る形式で作品1枚丸ごとを生成AIに書かせるのはアウトだろう。結局、生成AIが絵の面積にどのくらい占めるかや他者との類似性の有無が分かれ目になってくると思う。少なくとも作品の核の部分は自分で筆を入れる必要があるだろう。
最後に、丸ごと生成AIに作らせてしまってもOKな方法がある。それは自分の作品を生成AIに学習させて、テンプレートとしてLORA(Low-Rank Adaptation)モデルを自作することだ(これはもう少しまとめて次の記事にしようと思う)。これなら「自作」であることは間違いないし、量産できるだろう。
いずれの手法を使うにしても、ネットでアンチがぐちぐちしている間に、新規の絵描きは当然のように生成AIを使ってくるので、自分の手法をどうやって補うかを模索していかないといけないのだろう。
終わりに
ぐちぐち書いたけど、全部生成AIなら同じような絵や物語になる。綺麗だけど、癖がなくて、まぁつまらない。あくまで道具の生成AIをどう使いこなすかが、物づくりの一つの大切なスキルになるんだろうな。
まぁ、ほどほどに使おう(^ω^)
☆エロ同人CG販売中