最近話題となっているA.I.による自動作画がどういったものでどういう問題があるのかを整理して、イラスト生成サービスmimicとその炎上を考えてみる。
(今週の一枚)夜のお散歩(pixiv)
本題に入る前にA.I.お絵かきのとても基本的なことを書き、A.I.お絵かきの問題とmimicとその騒動について考えてみる。
A.I.による描画
そもそもA.I.(artifical intelligence 人工知能)によるお絵かきって何ぞやというと、別にロボットがウィーンウィーンと絵を描くのではなく、比較対象となるサンプル群から命令されたキーワードを使って情報を抽出して、情報の認識をして規則性を決め、それらしい絵を出力するというものだ。
簡単に言えば、グーグルにたくさんの動物の写真がある。人間が「犬」というキーワードを入力する。A.I.が犬ということになっている写真をたくさん拾ってきて、それを混ぜる。画面にその混ぜた写真(絵)を映す。…というものだ。
つまり、ロボットが自発的に絵を描くのでも、自由な発想の中から芸術を作るのでもなく、与えられた情報から指示に従って平均値を出力するというしごく初歩的なパーセプトロンを行っているものになる。
大量の情報と高い演算能力のPCがあって初めて実現した技術であり、問題点として与える情報が偏っていれば、偏った答えが出るし、命令がぼんやりしているとぼんやりしている答えしか出ない。例えば、犬と入力しても選ぶ写真群が猫だらけだったら猫になり、「動物」と雑に入力すればなんかよくわからない生き物が出力される。
一般に言われる機械学習とは規則性の検出であり、しっかりと意図をもって指示を出さないとちゃんとしたものが得られないものではないかと思う。
実際の人工知能お絵かき
最近、craiyonやMidjourneyやERNIE-ViLGといった画像を合成するソフトのベータ版が注目されるようになった。方式としてはテキストを入力しその文字に対して絵(写真)を出力するというものだ。
オープンソースではないのではっきりしたことは言えないが、それぞれの単語に対して(感情的なものや物理的なものを分けて)荷重をかけ、グーグルなどに大量にある画像群からそれと関連のあるものを複数枚拾って学習して、平均値合成と選択的なデータのランダム配置で一枚の絵にしてるんじゃないかと思う。
ビックデータからどんな写真を選択するかやどういった平均を出すかなどが各サービスの肝になってくるのだろう。
サービスとしてはお試しの基本使用無料でたくさん遊ぶなら有料、商用利用にはサブスクライセンス購入という流れになるみたいだ。
今のところ、遊び半分、お試し半分というところで、明確なビジネスにはなっていない。しかし、上手な人がうまく入力をすれば100枚に1枚位のペースでいい絵が出るみたいなのでアートの新しい可能性になる予感がある。
A.I.お絵かきの問題
大きな問題は2つあると思う。
一つは技術的なものだ。これらは「頭のいいA.I.」が絵を描くのではなく、ビックデータを基本とした入出力系になっている。そのため、そのデータが歪んでいれば絵も歪むという問題を持っている。
つまり、認識が確定しているもの(古い芸術、植物や動物などの形がある程度決まったもの)については平均値を出すことでそれらしいものを作ることが容易だが、評価や存在に揺らぎのあるもの(感情やアート)については確定して出力することが当然できない。規則性を定義することができないともいえる。
現状では、それをテキストデータで人間に入力させ、ランダムに配置することでいかにもそれらしい作品を仕上げているが、これはA.I.がお絵かきしたのではなく、入力する人間が言葉を選択し何回も機械を回して偶然出てきたものをその人のセンスで選んだ結果の産物になる。
そのため、現在流行っているサービスの多くはA.I.のなんらかの意図によって芸術を作成するのではなく、人間が使う道具として進化したペンや筆の一種として考えるべき代物ではないかと思う。
もう一つの問題は権利の所在だ。
これらのサービスはA.I.が無からお絵かきしたものではなく、ビックデータを中心に収集したものを基本として出力している。果たしてこれは「学習」によって得られたものかという疑問とともに、元となった写真などのデータは本当に許可を得て使用しているのか、出力された情報の権利はどこに帰属するのかよくわからない。
一応、これらサービスにおいて作成物の権利はデータ入力作成者とA.I.の作成者に帰属するみたいに言っているが、これはあくまで主張であって、元となったデータの所有者が訴えを起こした場合、勝てるかと言われればかなり微妙なのではないかと思う。
2019年に施行された改正著作権法を見ると、元データ利用には著作権があるとして、作成物の著作権・利用では明確な回答はまだない。
Suicaなどのビックデータはその使用に際して一応の許諾を取って収集しているが、検索サービスなどの収集行為はかなりグレーな面があり、それを利用して作られたものは当然グレーになる。
そのため、誰か「これは私のパクリだ」と主張をした場合、どういう解釈になるかは誰にもわからないのが現状であるし、類似性を悪用する人もいるだろう。
AIイラストメーカーmimicとは
さて、こういった新しいサービスが出てくる中で、日本でも同様の機械学習サービスがいくつも展開されている。その中で、クリエーター向けのサービスにmimicというものが登場した。
このサービスは上記のビックデータを前提としたものではなく、自分が書いたキャラクター(顔?)群から規則性を学習し、同じようなキャラを出力するサービスだ。
ここでのミソは「同じような顔」が必要ということだろう。出力された作品を見る限り、かなり限定されたキャラの顔が出力されている。ここから推察するに、機械学習できるものはアニメ漫画でよくあるヒラメ顔を前提とした顔(サンプルに偏りが少なく、線画を使って領域がはっきり区別される)の平均値をとっているのではないかと思う。
また、出力サンプルと説明文を見るに、しっかりとしたモデルを形成するというよりも、色付きのラフ画を出して、そのラフからヒントを得て、ご自分で清書してください的な使い方になるのだろう。
アイデアとしては非常に面白い試みだし、日本で好まれる萌え絵や顔の角度がある程度決まっているデザインのキャラに限れば、かなりいいサービスなのではないかと思う。
逆に言えば、イメージの異なるものを混ぜたり、ピクセル数が多く陰影が複雑な作品には不利なのではないかと感じた。
あくまで創作のアイデアとしてここから何かを作る手助け的な用途なのだろう。
mimic騒動
ちょっと震源地ははっきりわからなかったのだけど、このmimicのサービスが炎上した。
炎上理由は「このサービスを利用して他人の絵を盗んで合成すれば簡単にそれっぽいキャラが作れる」というものだ。
この情報はまったく正確でないが、可能性を煽る形で情報が拡散し、プロジェクトに協力した方への誹謗中傷やサイトに嫌がらせが多発したようだ。
賛成・反対派のほとんどがA.I.についての基本的なことを知らず、このサイトがどの程度の能力があるかなんかわからないで感情論で騒ぎ立て、こういった絵を描く人を不安に陥れて騒ぎが拡大した。
サイト側はこれ以上騒ぎが大きくなることやイメージの棄損を恐れていったサービスを停止して、こういった感情論や不正使用に対しての対処を練り直すことになったようだ。
なぜこんなことになるか
なんでこんなアホなことが起こるのか?
やっぱり原因は「この手の顔は描き方さえ学べば誰でも簡単に描ける」ことと「可能性に対する妄信」なんじゃないかと思う。
萌え顔の傾向には流行りすたりはあるけれど、引きで見ると大体同じ顔に見える。もちろん、そういった同じものの中にほんの少しの差異を作って個性を出している。瞳の美しさや髪の美麗さ、アクセサリーの装飾など様々なものを加えることで様々な個性を作り出すことができる。
顔そのものはとても描きやすい。しかし、その差異を作るにはとても大変だ。作者はいくつも失敗を経て今があるのだろう。その苦労・小さな差異を盗まれてしまうかもしれないという恐れと危惧が騒ぎにつながったように見える。
また、A.I.に対する妄信を強く感じた。ボタンを押せばすごいことができる!今まで頑張ってやってきたことが無になる…といったA.I.すごい論は各所にある。
すごいですよ~という記事や将来こんな風な未来が待ってます的な情報が氾濫しているからなんとなく流れでそういった情報に触れる人は表面的な情報から「あぁそうなのか、すごいなぁ」という刷り込みが行われるのだろう。
こういった刷り込みを前提として、煽られたRTから今回の騒動を見ると、確かにmimicとは恐ろしいA.I.サービスだし、誰かの技術が簡単にコピーされ権利を無視した違法利用が行われる気分になる。
騒動の実際
では、実際にそんなことが起こるのかを考えると、はっきり言って無理なんじゃないかと思う。
まず、叩かれたmimic自体、肩より上の顔のラフをちょちょっと出すだけのサービスだし、各種のデータ出力規制もある。この程度のデータなら、お絵かきの手助けにはなるだろうが、これをもって誰かの作画をまるパクリできるかというのは疑問だ。
また、もし悪い奴がいるとしてこんなめんどくさい方法はコスパが悪い。有名作家のトレースをするなり、ハードコピーして湯飲みにでもくっつけて売ったほうが楽に儲けられる。例え、このサービスを使って有名キャラ風の絵を描いてもあくまでそれは2次3次創作でしかなく、著作権に引っかかって簡単には売れない。
個人で自作発言をするのに使うとしても、先ほど言った機微のある美を作ることはできないので、その辺によくある絵として流されて終わるだろう。
さらに、こういったA.I.描画に関しても見当違いがとても多い。顔イラストに限っても、すでに性能的にこれ以上のサービスがたくさんあり、むしろmimicはその後続と言える。
・・・などなどキャラ作成サイトはいくらでもある。
なぜか後発のサービスが否定され、先発のサービスは何のお咎めがないのか。これは、mimicの良し悪し関係なくTwitterの文化(断片情報を無自覚に拡散する能力)が悪感情を煽ったためだろう。
今回に関しては、何兆円もかけて作られるビックデータビジネスのA.I.ディープラーニングとmimicの能力がごっちゃにされて拡大解釈され、自分たちの権利が侵害される恐怖を煽れれたために起こったと思われる。
まとめ
機械学習に関してはかなり技術革新してきているが、巷で騒がれている夢のような技術ではない。むしろ山あり山ありだろう。
絵を作るとしても、パターンを変えて何回も試行する必要があり、道具として考えたとしても、簡単に見えてむしろ普通に絵を描くよりもセンスが要求される。
感情論で騒ぐ人たちの危惧する「簡単に顔を描いてくれるサービス」は既に存在し稼働しているが、そこまで問題になっていないし、不安に陥った人が危惧するような能力はmimicにはなく、完全にとってはとばっちりだ。
終わりに
まぁ自分も絵を描くからボタン一つで苦労が無に帰す可能性は怖い。でも、それは新しい技術を使ってもっと上の絵を描ける可能性なんだからビビらず前進すればいいんじゃないかなぁ…そんな感じがした(^ω^)
☆エロ同人CG販売中