はじめに
こんにちは。あんどう(@t_andou)です。
前回は人工知能の技術として最近話題のディープラーニング(Deep Learning)で何ができるのかという一例として、モノクロ映画のカラー化をやってみました。
前回の記事はこちら
今回もディープラーニングを使った事例の紹介です。
今回紹介するのは画風変換と呼ばれるものです。英語ではStyle Transfer と言うようです。
画風変換とは
ある画像(インプット画像)を別の画像(スタイル画像)の画風で描き変えることです。
もしかしたら間違ってるかもしれません。でも、そんな感じです。
技術的に細かいことはこちらをご覧ください
GitHub - jcjohnson/neural-style: Torch implementation of neural style algorithm
例えば:(ピカチュウ+大神)
(著作権的にアレなのでモザイクをかけています)
こうなります
かっこいい!
この技術を何か他のことに使えないかと考えた結果…名画風のプロフィール写真を描いてもらうことにしました。
名画風のプロフィール画像を作ってもらった
ベースとなる画像 その1
まずは現在使っているプロフィール写真を使ってみました。
ダヴィンチ 自画像
ゴッホ 自画像
ピカソ 自画像
エッシャー 写像球体を持つ手
ミュシャ 夢想
ベースとなる画像 その2
・もう少し顔がアップで映っている画像のほうがいいかも?
・背景はない方が特徴を捉えやすいかも?
と考えて次の画像を用意してみました。
(ゴッホの自画像を意識した角度)
ゴッホ 自画像
怖い。
ミュシャ 夢想
ピカソ 自画像
ダヴィンチ 自画像
結構いい感じ
ピカソ 泣く女風
これが一番好き。(採用)
他にもやってみた
今回はプロフィール写真を作ることを目的にやってみましたが、風景や動物などもやってみました。
風景
これと
これで
現代アート風に
動物
可愛い子猫と
鼠よけの猫(の一部)で
可愛い子猫に
感想
ちゃんと名画風のプロフィール写真を作ってくれました。すごいですね。
もしかしたら写真よりもアニメやイラストの方が線がはっきりしているので画風変換をしやすいとかあるのかな?
将来的には人工知能がデフォルメした似顔絵なんかも描いてくれるようになるのかもしれませんね。楽しみ。楽しみ。
最後に
参考程度に技術的なこともメモしておきます。
スタイル画像が特徴的なほど、より上手く書き換えてくれるようです。特徴がよく出ている解像度が低い画像を用意できると良いかも? いつか検証したい。
環境とかかった時間
OSはubuntu 14.04。利用したモデルはVGG。1000iteration。GTX970の環境で、一枚当たりの処理は5分弱でした。(入力する解像度によって変わります。)
CPUのみで実行すると1枚の処理に数時間(下手すると数十時間)必要なんて事態になりかねないので、GPUを利用しないと厳しいです。
しかし、GPUを利用するために必要なCUDAやcuDNNのセットアップがかなり鬼門でした。2回ほどubuntuの再インストールをしました。でも一度セットアップ出来るとあとはコマンド一つで簡単に使えます。
GPUが使えなかった問題で参考にしたページ
TensorFlowでGPUが使えない | めがねをかけるんだ
TensorFlow on DockerでGPUを使えるようにする方法 | 株式会社カブク
いろんなライブラリで実行できます
今回利用したのはこちらのTorch7とloadcaffeによるものでしたが、他にもtensorflowやchainerを使ったものもあります。githubしゅごい。
https://github.com/jcjohnson/neural-style
tensorflowによる画風変換
https://github.com/anishathalye/neural-style
Chainerによる画風変換
https://github.com/mattya/chainer-gogh
それではー
もっと知りたいピカソ 生涯と作品 (アート・ビギナーズ・コレクション)
- 作者: 松田健児
- 出版社/メーカー: 東京美術
- 発売日: 2006/02/01
- メディア: 単行本
- クリック: 46回
- この商品を含むブログ (9件) を見る