ニートの言葉

元ニートがやってみたこと・その過程で学んだこと・考えたこと・技術メモあたりを主に書いています。情報革命が起きた後に訪れるであろう「一億総ニート時代」の生き方を考え中です。

【画像生成AI】素材画像を作るWebサービスを作りました【無料】

 

どうもこんにちは、あんどう(@t_andou)です。

今回はかいどうさん(@odiak_)と一緒に、画像を入れるとそれに似た画像素材を生成してくれるサービスを作りましたので紹介させてください。

経緯

以前、画像生成AIで書き出した画像を配布するサイトを作りましたが、その際に

今後は『検索をするように画像を生成して使うようになる。』そして『生成をするための文章をうまく表現する力 が重要になる』ということに気づきました。

しかし、全員がそんな力を持っているわけでもなく、その力を伸ばそうとするわけでもないため、そういう力を持っていない無い人でも気軽に使えるサービスを作ろうと考えました。

作ったもの

こちらになります。

ImageMart

・今は完全無料です(2022/09/12時点)
・ベータ版として招待制で公開しております。
・Googleアカウントでログイン出来るアドレスをご登録ください。
・サーバーの負荷などを見つつ、順次ご招待する予定です。

機能紹介

現時点での機能としては、「画像を入れるとそれに似た画像を生成してくれる」という機能の一点だけになります。

最近話題の画像生成AI「StableDiffusion」でも画像を入力としたimg2imgという機能はありますが、そちらでは文章の指定が必要になります。

ですが、今回作成したものではそれが不要です。

比較

それではStableDiffusionの呪文を入れない場合と今回作ったものを比較してみます。

比較1.お皿に何個かのいちごが乗っている写真

比較1-1.StableDiffusionのimg2imgを呪文無しで使った場合

 

1枚目は棚、3枚目はipodでしょうか?かろうじて2枚目に皿が写っていますが、どれも全然違うものになっていますね。

「お皿に乗ったいちごを真上から見た写真」などの呪文を書いた上で試行錯誤していくことで似た画像を生成することは可能だと思いますが、呪文無しでは全然ダメだということがわかります。

比較1-2.ImageMartで生成したもの

それではここからは今回作ったImageMartで生成した画像をご覧ください。

ちゃんとどれもお皿に乗ったいちごの画像になっています。

比較2.某魔法の映画に出てきそうな男の人の画像

この画像自体も生成AIが描いたものです

比較2-1.StableDiffusionのimg2imgを呪文無しで使った場合

これはこれで面白いですが、全然違うものが出ていますね。

比較2-2.ImageMartで生成したもの

ツッコミどころはありますが、先程の結果よりはだいぶ良い感じかと思います。

その他の例

その他にもImageMartで生成した例をあげておきます

最後に

今後は高品質で高画質な画像を作れるようにするなど、少しずつ機能を追加していく予定なので、ぜひご利用ください。

登録はこちらから → ImageMart

本記事で利用した画像

strawberries-strawberry-X4WYW1PWL5

Frog Leaf Free Stock CC0 Photo - StockSnap.io

Sunflower Field Free Stock CC0 - StockSnap.io

Autumn Colorful Free Stock CC0 Photo - StockSnap.io

AIでコウメ太夫さんのツイートを生成してみた その2

画像生成AIで書かれたコウメ太夫さん風の人物

どうもこんにちは、あんどう(@t_andou)です。

以前、コウメ太夫さんのツイートをAIに学習させたという記事を書きました。

以前の記事

blog.takuya-andou.com

 

今回は以前学習させたGPT-2よりも進化したバージョンであるGPT-3でコウメ太夫さんのツイートを生成してみたいと思います。

GPT-3に関しては精度がすごく良いので学習する必要がない*1と聞いたことがあるので、そのまま試してみます。

まずは前回のおさらい

 

意味はわからないですが、それがご本人っぽいですね。

GPT-3

それではGPT-3による生成です。

まずは参考に本物のツイートを二つほど見せて、そこから先は「〇〇かと思ったら〜」の部分だけを入力します。

背景色の無い文章が入力、緑背景の文章がAIによる生成です。

文章としての意味が通るようになっていますね。明らかに進化してます。

しかし、文章としての意味が通るようになったせいで、面白さは低下しているように見えます。

面白いって難しいですね。

 

GPT-3でも学習させるとご本人らしくなるのでしょうが、GPT-3の学習は重そうなので誰かがやってくれるのを待ってます。

おしまい。

StableDiffusionを使った画像素材サイトを作って気づいたこと

どうもこんにちは、あんどう(@t_andou)です。

前回、StableDifffusionを使って生成したテクスチャ画像の素材サイトを作ったと書きましたが、あれから写真素材についても少し試して追加しました。

前回の記事

blog.takuya-andou.com

今回追加した素材

今回は「水がグラスに注がれてるシーンの写真」で200枚ほど生成して、良さそうな24枚をアップロードしました。

気づいたこと

さて、ここからが本題です。

今回「水がグラスに注がれてるシーンの写真」を生成している途中に、今後の画像素材サイトのあり方について次のように確信しました。

これまで素材画像を探す時には自分のイメージに近い画像を検索で探して使っていたけれど、今後は(検索をするように)その場で自分のイメージに近い画像を生成して使うようになる

ということです。

前回ゴミを大量に生み出している気分になったと書きましたが、その感覚の正体はここにあって、今は僕が書き出してリストアップしているけれどそれは古いサイトの形であって、こういう素材サイトはnヶ月後かn年後には需要は無くなるだろう→ゴミになるだろうという確信からゴミを生み出してるという感覚になったようでした。

今では当たり前のように『検索をする力』が重要だと考えられていますが、今後は同じように『生成をするための文章(prompt / いわゆる呪文)をうまく表現する力』というのが重要になってくる=次に必要なリテラシーになるのだと感じました。

おしまい。

画像生成AIで無料の画像素材サイトを作ってみた【Stable Diffusion】

みなさんこんにちは、あんどう(@t_andou)です。

最近、画像生成AIの「Stable Diffusion」がとても話題になっていますね。

オープンソース・商用利用可能・精度も良いということで、僕もこれを使って何かしたいと思いましたが、ただ画像を生成するだけでは面白くありません。

そこで、

・AIが生成した画像や「呪文(画像生成に使う文章)」を売買出来るマーケット
・生成した画像のNFT化をするサイト

などを作れたら面白そうだと思ったのですが、時間がかかりそうなので、まずはサクッと着手できそうなところから試してみました。

作ったもの

前置きが長くなりましたが、今回作ったのはタイトルにもあるように『画像の素材配布サイト』です。

 

imagemart.net

画像の生成、ドメイン取得やサイト構築など全てを5時間くらいで作ったため、使い勝手はまだまだですが、どうぞ自由に使ってください。

画像の例

木目

古くなった赤い皮

新しい鉄板

黄色い石

他にも大量にあるので是非ご覧ください。

ぱっと思いついた単語を組み合わせて1000枚以上を作成しました。色々とエラーが起きたりで少し減って850枚程度がサイトにアップされています。

こんな素材が欲しいなどありましたらお気軽に@t_andouまでご連絡ください。

終わりに

たまに謎な画像が生成されていますが、この短時間でここまで出来るのはやはり凄いですね。
これは革命と言われるだけはあるなという印象でした。

ただ、全人類がこの画像生成AIを使いこなせるようになれば、このように大量の画像をリストアップしておくサイトは必要無いため、途中でゴミを大量に生み出しているるような感覚を覚えました。

とは言え、画像生成AIを使えない人がいる現時点ではこういうサイトの価値も残っていると信じて今後もゴミを生み出していきます。

それでは。

24時間生放送をし続ける人工知能youtuberを作る その5「雑談AIの作成」

こんにちは、あんどう(@t_andou)です。

24時間生放送をし続ける人工知能youtuberを作るシリーズですが、気づいたら前回の更新から3年放置していました。

当初の目的

blog.takuya-andou.com

前回までの記事

blog.takuya-andou.com

 

前回の更新から3年が経ち、自前でも精度を上げていけそうだったので、改めて雑談AIの作成をやりました。(※精度が上がっていくかどうかは僕のモチベーション次第)

以前はリクルートさんの雑談AIを利用させていただきました。

前回(3年前)時点での会話AI

そっけなくて人間味の無い回答が多かった印象です

スクショ

f:id:takuya0411:20220409071400p:plain

動画

youtu.be

今回の会話AI

youtube配信者であるという自覚を持っているようです。

また、返答もそれらしい文章になっています。

スクショ

f:id:takuya0411:20220409071254p:plain

動画

youtu.be

AI同士に雑談をさせてみました

上二つに関しては、当初の予定通り「YoutubeLiveでのコメントに反応」するようにしていたのですが、コメント自体が少ないためAI同士に会話をさせてみました。

颯太:15歳の男子高校生の設定
幸子:81歳のお団子大好きおばあちゃん設定

個性の設定が甘いのかデータセットの問題なのか、あまり個性の違いを感じることは出来ませんでした。が、それらしい会話を無限に続けているのは面白いです。

f:id:takuya0411:20220409071706p:plain


www.youtube.com

作り方

技術的な詳細は本記事では割愛しますが、基本的にこれらのリンク先を参考にしました。

二つ目の記事に書かれているように学習のデータセットは自分で用意する必要があります。

note.com

zanote.net

最後に

どうでも良い報告ですが、試行錯誤をしていた結果、12時間以上?放送してしまうとYoutubeのアーカイブが見れなくなり、自分の動画であってもダウンロード出来なくなるようですので「24時間生放送をし続ける」は技術的には可能ですが12時間未満にした方がよさそうだと気づきました。(タイトル的には24時間〜のままにします)

見れなくなった動画

長さが22時間30分程度でした。

youtu.be

人工知能にコウメ太夫さんのツイートを学習させてみた

f:id:takuya0411:20211031073953p:plain

どうもこんにちは、最近何かを生成する系のAIで遊ぶことにハマってます、あんどう(@t_andou)です。

5年以上前の話ですが、人工知能に哲学書を読ませて哲学的な文章を書いてもらいました。

blog.takuya-andou.com

今回はその時よりも高度な「GPT-2」というものを使って、コウメ太夫さんのツイートを学習させてみたいと思います。

なぜコウメ太夫さんなのか

コウメ太夫さんと言えば、毎日とても面白いギャグツイートすることで有名なかたです。

ですが、ごく稀に難解すぎてAIがツイートしてると疑われ、記事になることもあります。*1

AIが考えたと言われているツイート

これを見て思いました。

コウメ太夫さんのツイートを学習させたらそれらしく生成できるのでは?

と、いうことで学習させてみました。学習のやり方については最後に載せています。

まずは結果から。

結果

本人のツイートと比較していきます。

本人のツイート

ピ~タンをすぐ飛ばして斜めになるメスザル…?これ…本当にAIが書いてるのでは…?

では、次にAIの書いたものを見てみましょう。

AIが書いたもの

比較のため冒頭の『修学旅行で~~かと思ったら~、』の一文はそのまま指定し、続きを書いてもらいます。

修学旅行で勢いで買いがちなもの1位は{土地}かと思ったら~

{ハエ取り巻き歩きガイド}でした~。
チクショー!!

ああ〜意味の分からなさがそれっぽい。そして、最後が「チクショー!!」で終わっているので、学習出来ていることが分かりますね。

他のツイートも見てみましょう。

本人のツイート

流石コウメ先生です。僕には理解できませんでした。

AIのツイート

同じ文章からいくつか書いてもらいました。

1000倍の速さで成長してると思ったら~、
全身の毛穴から汗が出てきて~、

私の脳みそがソフトだった~

チクショー!!
私の脳みそなかった~。

チクショー!

超高速!超チクショー!!
頭脳 5000倍でした~。

チクショー!!
コアが3000000000000倍でした~。

チクショー!!
私の脳みそ滅菌してました~。

チクショー!!
私の脳みそ100000000倍でした~。

チクショー!!
私の人生は0よチクショー!!でした~。

チクショー!!
我々の想像を超えてました~。

チクショー!!
地球は10000倍のスピードで移動してました~。

チクショー!!

やたらと脳みそのことに言及してるのが気持ち悪いですね。

しかし、『1000倍の速さで成長』という言葉に対応して10000倍などと書いてるのは凄いです。

その他のツイート

これはAIの方が分かりやすい気がします。

これはご本人の方が分かりやすいですね。

オリジナルツイート

その他にオリジナルのツイートも見てみましょう。

すごくそれっぽい。

学習の仕方

こちらの記事を参考にさせていただきました。

note.com

終わりに

面白いかどうかはともかく、良い感じに学習できてそうです。

GPT-2と言えばだいぶ重いイメージがあったのですが、ファインチューニングであれば10分~15分程度である程度まで学習できました。

データさえ揃えば気軽に歌詞を学習させたり短歌を学習させたりとかも出来そうです。

日本語版GPT-2を公開してくださったtanreinamaさんには感謝です。

 

Twitterアカウントを開設しました → コウメAI太夫

顔写真はAIで生成したコウメ太夫さんに似てる架空の女性です。

人工知能に『桃太郎』を描いてもらった

f:id:takuya0411:20211025045716p:plain

 

どうもこんにちは、あんどう(@t_andou)です。

前回、AIに絵本を描いてもらいました。

blog.takuya-andou.com

絵だけじゃなく物語やBGMの作曲、読み上げなど全てをAIに任せた結果、物語の意味が全く分からなくなったので、もう少し意味がわかる…というか、大体の日本人なら知ってるであろう物語『桃太郎』を描いてもらいました。


www.youtube.com

サムネは良い感じに作れたのではないかと思います。