人類 vs 生成モデル

たまには駄文。画像やイラストの生成モデルが流行してから半年くらい経ったのかな。最近は対話 AI も出てきて凄いことになってきました。そろそろ答え合わせする時が来ているのかなと思うので、感じているところをまとめてみます。

法律が穴だらけ (補足: 1/3)

現状の法律的には、違法データ (Danbooru) から学習しても、なんと違法にはならない。あくまで違法データの提供元 (Danbooru) が悪いとなる。ただ Danbooru もおそらくは脱法する気はそこまでなく、管理しきれない違法データがある状態と理解している。まさかそのようなサイトから勝手に学習して商用化する行為 (WD, Novel AI) は、さすがに意図していないと思われる。この時点で権利侵害だし、違法データの中に NC があったとしたら、本来の意図に反しているし権利も侵害しているから、商用はライセンス違反…と思ってたけど違うのかな。それより問題なのは、違法的に学習されたモデル (NAI) をネットに放流して、再学習したりしている界隈全体。放流されたモデルから再学習した場合は、データから学習している訳ではないので、NAI に責任を押し付けることで、なんと違法にならない。こうして俗に言うライセンスのたらい回しがいくらでもできてしまっているのは、いかがなものか。

個人的な感覚では AI イラストの一定量は著作権侵害

AI イラストの生成モデルの多くは、収集の時点で著作権やライセンスを意図的に無視しているので、サービス化はアウトと個人的には思う。Copilot なども同じ。ちなみに技術そのものはフェアユースと思われるし、良いものだと思うし、止まらないと思う。 Clean Diffusion のような路線が、長い目で見れば一番良さそう。テキスト版の Common Crawl を画像で作っても、中身のシャッフルができる訳でもなく、それは本当に OK なのかな。

イラスト生成とゲーム実況はよく似ている

ゲーム実況も元コンテンツを勝手に利用している時点でかなりグレーだった。ただ今は規約が追加され、作者と実況者の間で受け入れられるようになった。ここで過去の作品にも作者が条項を追加できているのは、重要なポイント。このへんの詳細は不明だけど、イラスト生成にもこのルールを適用すると、後から駄目と作者に言われたら再学習しないといけない。これは大変。

個人の権利がより重要になる

勝手に画像を使って、勝手に画風を真似てもフェアユース？それはないと感じる。検索エンジンは robots.txt などのブロック手段を用意したから許されているので、イラスト生成はその観点が抜けている。強力に個人の権利を侵害する可能性があるので、意図的な収集は GDPR より問題と思う。 AI の再学習コスト的に、AI のハードルになりそう。仮に OK が出ると、それはそれで凄いことになりそう。AI なら何やっても OK なんだな、と。

概念の扱いがポイントになりそう

ChatGPT では意図的に固有名詞を深く扱っていないように見える。イラストでもこれは使える。初音ミクという概念を学習しても、その語彙を意図的に「女の子」などに置換して画像を生成した場合、それは著作権的にどうか。つまり危険なワードを近似ベクトルに置換してしまえば著作権的に OK ではないかと言われると、そうかも知れない。人間も頭で同じことをやってるしね。この方法を使うと、データも違法な方法で取得したかは判別不能そう。まあでもイラストはタグで Danbooru とわかるよね。このへんの扱いは気になる。 Danbooru は現状で問題しかないけど、それをクリアすれば直感的にセーフになりそうな気がするので、やはり技術的には止まらなそうか。ただ最近はプロンプト攻撃 (禁止ワードを無理やり作り出す) なるものがあるらしいので、そんなに簡単ではないかも。

現時点でもイラスト AI は 95% 以上の人間より優秀

5% の領域 (概念の不明瞭な領域、手などの細かな特徴) などはすぐ修正される。この 5% の領域もすぐ 2% くらいまで行くので、人間はほぼ勝てない。

AI は人間の上位存在として対策することが前提になる

人間と AI を区別しないと、予想 5年で人間がやってられなくなる。やってられなくなるからこそ区分けが必要になる。結果だけからでは AI と人間の判別は不可能なので、囲碁・将棋で言うソフト指し対策が全分野で基本になる。

人間より高速なのでコンテンツが溢れ返る

AI はコンテンツをものすごい速度で作ってしまう。そのせいで乱雑なネットからの検索は汚染されて不可能になるし、これは既になっている。テキストと画像はもう完全に駄目かも知れない。人間と AI を区別した上で、さらにビジネスモデルにも変化がいる。

予想 5年で人間は人間以上になる

生成モデルを利用した人間の進化は向こう10年くらい凄いことになりそう。5年以内に人間はすごく進化する。それなりのものはすべて一人でできるから分業が難しくなる。どう変わるかというとプロは必要だから残るけど、アマが猛烈に強くなる。ゲームや囲碁・将棋がわかりやすい。

人間以上になるためにはお金が掛かる＝つらい

人間の性能を抜き去ろうとすると GPT-3 のように個人で扱えなくなる。金銭面に限界があるので向こう 5年くらいの普及は限定的かも。イラスト月額1,500円はプロ用価格。ハードとアルゴリズムが進化して安くなってからが本番。時期はあまり読めない。

著作権と商標権がもう少し真面目に扱われるようになる？

最近の AI 界隈がやってる著作権のガン無視はさすがにちょっと気になる。そして開発者のこのような考え方にも賛同しかねる。 AI の人間超えが当たり前になったことで、人間以上の規制をしないと迷惑が大きくなっている。 AI が作ったものに著作権はない、は今後あまり通用する気がしない。

大量生成されたコンテンツによる悪影響が顕著になる

既になってるけど、自信を持って 5年以内にもっとひどいことになる。 AI が大量のゴミをネット上に生成して、コンテンツが爆発して管理できない時代になる。著作権や商標権などは拡張が必要。逆に言えばきちんとお金を払えば Win-Win そう。コンテンツの多い日本は、他国が AI したらチャリンチャリンな状態にしなければいけない。

生成モデルの限界は資金面以外ではたぶんない

できないことは人間の成長と共に概念を拡張すればいい。それも限界となったら囲碁将棋と同じように自己対戦の時代が来るし、もうやってる。

AI は分野をすぐ飽和させる

AI は歴史をかっ飛ばして答えを一気に出すビジネスモデル。歴史がないからすぐにユーザ数が飽和してあまり伸びない。最後の進化は細かい微調整のみ。 OSS 化が猛烈に早く、リリース時点で 95% 完成されているから頭打ちが早い。

分野の変化は囲碁・将棋ソフトがわかりやすい

アプリに組み込まれ、売上はフラット化して一定層のコアユーザが課金していくモデルが多くなりそう。イラストは一般人が入りやすいのでユーザはより伸びそうだけど、課金が高くなりそうなのでプロ向けになりそう。アマは安くして欲しい (願望)。

AI はすぐ飽きる？

AI イラストは長く流行るかと思ったら、すぐ飽きた人も多いみたい。パターンを変える方法が少ない、難しいことが原因そうなので解決はできそう。ただしすぐに作れる＝飽きるが根源の場合、重要なのは過程を楽しむことだとわかる。

一般回答は既に人間を超えている

最近出てきた対話 AI は、高度回答は難しい反面、一般回答は人間並、コードも書ける模様。高度回答もイラストのように特化させればできそうなので死角はない。ただし平気で嘘を付くので、依存しすぎるのは危ないと思う。

検索より対話、対話より…

ネットがさらにゴミで溢れると、検索より対話のほうが早くなりそう。そんな時代になると、対話の進化も止まる。検索や対話で確認できないことに価値が出てくる。特に新しさや、高度な理解をもって実演できることは大切になりそう。

人間の仕事を考える必要がある

条件に合った薬を選ぶ、画像を分類するなどの解答がラベルの問題はもう人間は勝負にならない。イラストを描くことも、90% の人には AI が勝てる。自然言語処理も、前から人間レベル。 ChatGPT はアメリカの司法試験は合格できて、医師国家試験でも良い点が出ている (12/12)。筆記試験はオワコン。プログラミングは今のところプログラマの中で 50% くらいの実力らしい。一般人基準だと 90% くらいの数値になるんじゃないか。もう並の人間よりはどんな分野でも AI のほうがつよい。

でも今の AI は事実以外はうまく扱えない。たとえば AI に曖昧性の高い歴史研究などは当分無理そう。ゴミデータ問題も今後重くのしかかって来る。課題はある。あと恣意的・政治的な学習をされても外部から判断が付かないし、思考誘導される可能性が高いのは危ない気がする。もっともたいていの検索エンジンが恣意的・政治的なのは報道されてわかってるので、大差ないかも知れないけど (2/18)。他にも算数は苦手らしい。まあ完全性を求める分野なのでそうかなという気はするけど、公式に特化した研究もされているので、絶対的に苦手な領域とは思わない。

イラストを描いたり、プログラミングをさせたり、解答を考えさせるのも一般人以上は間違いないけど、これも限界はわかりやすい。コンテキストが少なくて良い常識的な問題は、データもたくさんあるので極めて強い。一定レベルはポンと出るけど、それを完璧なものにしようとすると、説明コストはどうやっても高くつく。これはフレーム問題の延長線だね。画像生成の呪文も大変だし、プログラミングを丁寧に説明するのは地獄で、もはや自分で書いたほうが早い。結局は、AI 以上に分野を理解していることが大切なのは、まだまだ変わらないのだろう。

5年くらいで色々なものが大きく変わりそうな印象です。すごいなー。

marmooo's blog

2022年12月3日土曜日