craiyonの新しいバージョンに課金してAI画像生成してみた

craiyonはAI画像生成ツール、Webサイト。2021年にDALL-E Miniという名前で誕生した。基本的に無料で使える。

先日新しいバージョンになって、クオリティが上がった。最初は256*256pxのサイズだったと記憶しているが、1024*1024pxになり、有料プランも登場した。とりあえず6ドル/1ヶ月のプランに課金してみた。課金しても生成画像のクオリティ自体は変わらないので、別に無料プランのまま使ってもいいが、お試しで。決済はstripeを使用しているので安全だろう。プランは変更可能のようだ。

画像
真ん中のプランに課金。年払いだと5ドル/1ヶ月にまで安くなる。
画像
決済後のページ。

使ってみた感想。無料プランだと画像の右下についていたクレヨンのマークが消え、生成に60秒以上かかっていたのが40秒程度になった。DALL-Eゆずりのプロンプトに実直なテイストは個人的に好みだ。細部は崩れがちだが画像拡大ツールを使えばそれなりに見られるレベルになる。ネガティブプロンプトやインペイント、アウトペイントなどの付加機能は一切無いが、制限のあるなかで活かし方を考えるのもまた楽しい。Webから気軽に無料または安価で遊べるオモチャとしての魅力が増した。

なお、旧バージョンのDALL-E MiniはHugging Faceのサイトから今のところ使用できるので、新旧バージョンで生成して比べてみると面白いかも。

以下にcraiyonでの生成画像と参考プロンプトなどを載せた。なるべく多様な生成物を。プロンプトは普段ごちゃごちゃ切り貼りしてるんだけど、今回は人様に見せるし、現在主流のStableDiffusionMidjourneyDALL-E2とかでも使いまわせる汎用的な表現を意識していろいろ使ってみたので参考にどうぞ。公式ツイッターによるとcraiyonも日々進化しているとのことなので、同じプロンプトでも品質は良くなっていくかも。

顔メインの画像はGFPGANcodeformer、その他は別の拡大ツールでそれぞれ高精細化させているので、クリック・タップやピンチアウトで拡大してみてね。

画像
クローズアップの顔はGFPGANでお直しするとそれなりになる。Prompt: photo of Japanese high school girl smiling, live-action, well-formed anime-like cute face, close-up of face, large rounded eyes, wearing plain school uniform, dark bob hair with bangs, in mall
画像
よくやる上からの撮影で顎を引いて小顔感出すやつ。overhead view = view from aboveとかでもいい。Prompt: close-up overhead photo of Japanese high school girl, anime-like well-formed symmetrical face, large rounded eyes, wearing plain school uniform, glossy dark bob hair with bangs, positive expression, indoors
画像
ステージ上のアイドルがはにかむ。AIに人間くさい表情を描かせるのは楽しい。Prompt: close-up photo of Japanese female idol embarrassed smiling, well-formed symmetrical lovely face, shy expression, rosy cheeks, large rounded eyes, wearing neat collar blouse, brown loose wavy hair, on stage
画像
これはcraiyonではなく、上と全く同じプロンプトをDALL-E2で描かせたもの。AIによって描写が変わる。
画像
AIがそのデータを学習していればだけど、整った顔は既存のアイドルグループをプロンプトに入れるのが一番手っ取り早いことに気づいた。Prompt: candid photo of a Nogizaka46 AKB48 girl, looking far away, focus on face, wearing a black sheer maid outfit, urban outdoors, soft natural lighting, high resolution
画像
もう一枚。画像拡大はGFPGANではなくこれのみcodeformerを使用してみたが優秀、craiyonで生成した画像と相性が良いわ。Prompt: photo of nogizaka46 girl, innocent smile, focus on face, live-action, wearing girly white collared blouse with bow tie, center position, urban outdoors, at dusk, romantic, high resolution
画像
スキンケアの広告にありそうなスッピン風写真。顔修正が強いGFPGANを使わず素の実力で載せてみる。@@@は広告を意味する英語だけど、ADブロッカーが誤反応するかもなので一応伏せた。Prompt: @@@ photo for skincare products, Japanese female fashion model, 20 years old, close-up of well-formed symmetrical front bareface without makeup, smooth pale skin, stunning eyes, wearing plain underwear, glossy dark long one-length hair, solid background, center position
画像
全身画像で顔が崩れても光源足して雰囲気でごまかす。golden hourは日没前後の時間を指す写真や映像用語でsunset lightと同様の効果。Prompt: candid photo of Japanese high school girl smiling and posing, live-action, well-formed anime-like cute face, large rounded eyes, wearing plain school uniform, dark long hair blowing in wind, at seaside, medium shot, golden hour, calm atmosphere
画像
ニュースキャスターに身振り手振りさせる。Prompt: photo of Japanese female news anchor slightly smiling and gesturing, live-action, well-formed face, wearing plain dark business dress, dark short hair, in news show, shallow depth of field
画像
童貞をxxす目的のためだけに作られた会社。ターゲットの男性は一人ずつ呼び出され囲まれておしくらまんじゅうの責苦を受ける。Prompt: photo of Japanese woman smiling at desk in office, close-up, plain dark long hair, womanly large breast and slim body, wearing low-cut beige knit dress, center position
画像
トー横界隈の暗部を撮ってきたドキュメンタリー的な。細部の無茶苦茶さ加減はアート的で合ってるかも。Prompt: disposable camera photo of a goth girl squatting in a dirty toilet in Tokyo, slightly fisheye effect, cinematic color grading
画像
ダークファンタジー。デジタルアート系画風はMidjourneyが最強だけどこちらも悪くない出来。これ系の著名アーティストgreg rutkowski氏の名前を入れると良好な絵が作れるかもだが本人が嫌がってるそうなので…。自分は昔から末弥純が好き。Prompt: close-up of horrific knight, in misty dark palace, equipped with sword and large shield and red cape, medieval dark fantasy world, detailed digital painting, cinematic lighting, muted colors
画像
アニメ系は顔や手指が苦手でも風景ならいける。Prompt: idyllic countryside, huts and water mills, illustration by Hayao Miyazaki of Studio Ghibli
画像
細部を気にしなくていい絵はcraiyon向き。Prompt: Crow on top of mailbox, textured oil painting, pop art
画像
アニメ文化をモチーフにしたインチキ現代アート。白黒やホラーテイストに振っても面白いかも。この種の絵もAIに代替されるんじゃないか。間違って高額で売買されたら面白い。Prompt: abstract oil painting of many diverse cute anime character faces arranged irregularly, rough brushstrokes, pop art, vivid, kitsch, weird
画像
キッチュな画作りにcraiyonは最適。子供向けなのか大人が見るのか謎のアクション物の低予算番組。エロビデオのワンシーンかもしれない。場所を原っぱとか田んぼにするとチープ感増す。こういう絵は顔や細部が潰れてても問題ない。craiyonは比較的に緩いが、他のサービスでsexyやbreastsがBANワードな場合はwomanlyやchestなど穏当な類語に置き換える。Prompt: footage of Japanese live-action tv show, 2000s, sexy female android holding a gun in field, wearing futuristic helmet and sheer bodysuit, big breasts, strong sunlight, dynamic composition
画像
昭和か平成のプロレス。不鮮明であるほどシュートを仕掛けた伝説のモンド映像感が出て良きかな。Prompt: footage of professional wrestling in Japan, 1990s, VHS noise
画像
打ち捨てられた軍手とマスク。新旧2大道端に落ちてがちなものたちが寄り添う。こんな素材でもなんとかエモくできないかと工夫してみたがいい軍手が描けずこの程度で諦めた。Prompt: dirty white knit work glove over disposable mask in a puddle on a wet road, dutch angle, shallow depth of field, sunset light, calm atmosphere, cinematic LUT
画像
AIは既存の製品を描かせると別の世界線風の違和感が出て良いけどcraiyonも頑張れてる。Prompt: photo of a 1980s game console on a cluttered desk, cinematic, unlit, shallow depth of field
画像
雑コラ的な画像もcraiyonの荒さが合ってるかも。宇宙猫あるいは全てを知ってしまった猫のミーム。Prompt: collage photo of surprised cat with eyes wide open at bottom of screen, galactic space background
画像
最後にcraiyonだけにクレヨンで描いた家族の絵でひとまずお別れ。俺より実りある人生を送るAIの住人。Prompt: happy family drawn by a child on the wall with crayon
画像
更に追加。レトロフュチャーな風景。絵皿に絵の具を出していくイメージで適当に色指定してもいい感じ。Prompt: detailed landscape photo, glossy monorail in future city, futuristic buildings behind, clear daylight, art deco, atompunk, retrofuturism, white, beige, orange, black, high contrast
画像
架空のループハイウェイ。地形図みたいな絵は箱庭感覚で滑走路や秘密基地など建造物を入れたりファンタジー世界にしたり、aerial view、top viewなど視点を色々変えたりと色々楽しめる。Prompt: ultra detailed satellite view of loop highway by lake in Japan

追記。1ヶ月触ったタイミングで、結局年額240ドルの最上級プランに変更してしまった。遊び倒す。

読んで面白かったらTwitterでいいねとリツイートしてね!