AIの力を借りてMVを作成

自分の音楽にどんな色を付けるかが大事だと思う

最近のヒット曲を見るとアニメのOP曲が流行る傾向があります。曲を聴くかどうかの前にどんなイメージを先行させるかが大切な気がします。そこで自分でよいイメージを与える事の出来るMVを作ってみようというわけです。
AIに描いてもらいました。ギターはAIにとって難易度高いです。これなんか怪しい(笑)

AIを積極的に活用

CHAT GPTに見られるようにAIがもてはやされていますが、AIによるイラスト作成・写真作成も大変な流行となっているように思います。今回はStable diffusionを使って自分の曲に合わせたイラストを作ってもらおうと準備しました。

ローカル環境でStable diffusion

Web上で様々なAIによるイラスト生成のサービスがありますが、より細かい設定と狙った絵を目指すならば自分のパソコンでStable diffusionを動作させる方が良いと考えました。絵の生成は納得のいく絵を目指すために試行の回数が多くなり、Web上では少々制約が出てしまいます。

グラフィックボードが必要だった

自分のパソコンでStable diffusionを動作せせるためにはゲームで使用するようなグラフィックボードが必要になります。グラフィックボードはマイニングの影響があって市場価格が上がってしまい、中々手にすることが難しかったですが現在は少し落ち着いてきています・・・しかし今なお5万前後の値段であり、これ以上下がることは当面ないのではと思われます。

現在動作させることのできる最安のグラフィックボードがGeforceRTX3060です。自分のパソコンで動かすためには最低でもこれが必要です。とにかく求めるイラストの生成には時間がかかりますのでできるだけ良いものがいいと思います。とにかくクソ高いです(笑)高いのにそれでもミドルクラスとはがっかりします。
間違ってRTX3060Tiを買ってしまった
私の場合メモリーが8GしかないRTX3060Tiを買ってしまいました。Stable diffusionを学習させたい場合は12Gが必要らしいのですが、学習はしないのでとりあえずこちらでも問題なく動作しています。昔はグラフィックボードはPCをうるさくする元凶と思っていましたが、ほとんど音しません。大変静かです。

Stable diffusionをインストール

自分の環境にStable diffusionをインストールするのは方法がWeb上に載っていますのでここでは説明しません。順序に従って行けばすんなりインストールされます。動作はブラウザを使って動作します。問題はインストールしてから自分好みに使えるようにカスタマイズする事です。私はStable diffusionをインストールして呪文を参考にしてやれば絵ができるのだろうと思っていましたが、それだけだとまともな絵が生成されないことがわかりました。あらかじめモデルを学習したCheckPointsやLoraと言われるプログラムを自分の作りたい絵に合わせてインストールしなければなりません。また学習されているモデルが主にアニメの女の子や子供、裸など受けが良いものばかりなので、老人やおじさんを生成するのは難しいのが現状です。私は今回「BrainDance BD018」というモデルを使用しています。ネガティブプロンプトもEasyNagativeV2を使っています。

生成には時間がかかる

サイズはYoutubeサイズ1280×720で生成しましたが、一枚生成されるのに2~3分くらいかかりました。今回は背景の場所が決まっていたので実際にその場所に行き写真を何枚も取り、その中から気に入ったものをStable diffusionに読み込ませて、それを参考に絵をかかせます。気に入ったものができるまで何度も試しますので2日くらい費やしました。それでも若干手足がおかしいもの、輪郭が甘いもの、なんなのか不明なものが出来ますのでそこらへんはある程度線引きしました。これがプロ仕事になればもっと時間をかけるだろうし、高価なRTX4090あたりを使用するのでしょう。出来た画像は若干彩度が物足りなかったりしますので画像編集ソフトで修正します。うまい呪文ができれば以下の絵も作れたりします。
AIギター少女でイメージアップを。このサイトもこれで行こう(笑)

絵を選んでそれに合わせて演奏を録音

オリジナルとして録音したものもあったのですが、結局絵を見ているうちに録り直すことにしました。暑いのでクーラーはつけっぱなし、外はセミの鳴き声という最悪な環境でしたが、iZotope RXの力を借りました。ギターはHashimoto 271を使用。
素人のやっつけ仕事なので大甘に見ていただければ💦 絵も不自然な不思議なところがいっぱいありますが、とにかくイメージを先行で。歌のないインストギターが生き残るにはおじさんがしかめ面してギターを弾くよりは目を引き付ける美しいイラストに音が付いてくる方がいいと思いませんか?


【関連記事】

0 件のコメント :

コメントを投稿

にほんブログ村

PVアクセスランキング にほんブログ村