こんにちは、AI推進チームのかけるです。
このたびLIGはおかげさまで「第20期」を迎え、先日FY20上期のキックオフを開催しました。
そんな節目となるキックオフの開催前、弊社代表の大山さんから「AI推進チームの方針とか、今のチームの取り組みをまとめたプレゼン動画を作って発表してくれない?」と無茶振りご相談をいただきました。
▲大山さん(左上)から相談時のMTG。困っているのが態度に出ているのが自分(右上)。
正直、動画を一度も作ったことがなかったのでちゃんと困ったのですが、最終的にはこんな動画を作りました。
▲本記事公開用のダイジェストverになります。
実はこの動画、ほぼすべてをAIで作らせています。
自分とCTOのづやさんがクローンされたAIアバターが、チームの方針やAIでの取り組みについて話している動画です。一見作るのが難しそうですが、誰でも簡単に作れちゃいます。
この記事では、その制作方法や制作過程での工夫をまとめたのでお伝えします。
- 商品紹介やSNS用動画、プロモーション動画を作りたい
- AIアバターが解説するeラーニング教材を作りたい
- 自分そっくりのAIアバター×動画を作りたい
など、AI×動画制作を模索している方にとって少しでもお役に立てば嬉しいです!
目次
AIアバター動画が作れる「HeyGen」とは
本来、人がしゃべって解説するプレゼンテーション動画を制作する場合は……
- プレゼン資料を用意する
- トークスクリプトを作る
- トークスクリプトを覚える
- プレゼンの練習をする
- 本番撮影
- 動画編集
- 完成
などなど、ざっくり挙げただけでも結構な作業が必要です。しかも、本番の撮影がうまくいかなったときは、一から撮り直したりカット編集に時間がかかったりします。
僕たちはAI推進チームなので、AIを活用することでそういった従来の動画制作の不便さをまるまるスキップしたい。
そこで今回は、自分そっくりのAIアバターの動画を制作できる「HeyGen(ヘイジェン)」を使いました。
- HeyGenとは
Free AI Video Generator : Create Stunning AI Videos
テキストや顔写真(動画)、音声データを入力するだけで、複数のAIアバターや合成音声を作成し、オリジナルのAIアバター動画を自動生成できるAIツール。無料でも利用できるが、クレジット制限があるのと、商用利用が不可。
▲教育向けやプレゼンテーション向けなどさまざまな動画テンプレートが用意されている
HeyGenでは、こういった自分のAIアバターとさまざまなデザインの動画テンプレートを組み合わせることで、実際に自分が話しているかのような、AIアバター動画を作れます。
HeyGenで動画制作すると、さきほどの作業が……
- AIアバターを作る
- 動画スライドを作る
- トークスクリプトを作る
- 完成
これだけシンプルになります。従来かかるであろう作業時間を考えると、だいたい1/3ほどに短縮される計算になります。現地での撮影が不要になるなど、物理的な環境にもほぼ左右されないので、PCひとつあればどこでも動画を作ることができるのもありがたい。
今回の制作では、僕のAIアバターだけではなく、多忙でなかなか撮影の時間が取れない弊社CTOのづやさんのAIアバターも作っていきます。
1. Webカメラで録画して、自分のAIアバターを作る

HeyGenで自分のAIアバターを作る方法は2つ。
- ビデオから開始:本人の動画から顔と声のクローンを生成
- 写真から開始:複数枚の写真から顔のクローンを生成(音声は別)
どちらも簡単に作れますが、 より動画の精度を高めるなら「ビデオから開始」がオススメ。

今回僕は「ビデオから開始」で、その場で顔と声のデータを取得する「Webカメラで録画」で作りました。
そして作ったAIアバター(プレビュー)がこちら。
声のクローンもリップシンクもほぼ完璧! 日本語だけではなく、英語とスペイン語のスピーチもまったく違和感がなく自然です。
ここまでにかかった時間は、たったの10分程度。超速いです。
2. 既存の素材から、づやさんのAIアバターを作る
続いて、づやさんのAIアバターを作っていきましょう。
自分と同様に「ビデオから開始」で作ってもよかったのですが、せっかくなので既存のデータだけを使ってゼロから作る方法を試したいと思います。
づやさんの声のクローンを作る
まずは声を作っていきます。
HeyGenの声のクローンでは、最低2〜5分のその人物だけが話している音声サンプルが必要です。すでに音声サンプルがあれば良いですが、今回その音声が見つからなかったため……
▲音楽編集ツールを使って地道にづやさんの声だけをトリミング
仕方がないので、過去の社内MTGの録画からづやさんの声だけを抽出しました。
これに限った話ではないですが、他人の音声クローン生成はパブリシティやプライバシーの権利でトラブルになることもあるので、事前に合意を取りましょう。悪用厳禁!
づやさんの見た目を作る
声のクローンの次は、見た目を作っていきます。
HeyGenでは、写真をもとにその人物のAIアバターを作る「写真から開始」機能もあります。今回はその方法でAIアバターを作ります。

なにか良い感じの写真ないかなー、と探していたら、大量のづやさんが撮られている写真フォルダを偶然発見しました。なにが目的なのか謎ですが、いい素材になりそうなのでこれをHeyGenに渡していきます。

また、複数の写真があると生成の精度が上がるので、他の写真データもしっかり渡していきます。
そして作ったAIアバター(プレビュー)がこちら。
実際の本人よりもだいぶ海外仕様にチューニングされた感がありますが、リップシンクやまばたき、ジェスチャーは自然! 音声クローンも、ほぼ本人と同じでバッチリでした。
僕の「ビデオから開始」で作ったAIアバターと比べると若干AIっぽさが残るものの、全体でみたらクオリティは十分。
3. AIアバターのプレゼン動画を作る
僕とづやさんのAIアバターはこれで完成しました。ここからはさっそくそれらのAIアバターの動画を作っていきます。
動画のストーリーは大まかにこんな感じです。
- 僕のAIアバター:冒頭挨拶
- 僕のAIアバター:チーム方針の背景を解説
- 僕のAIアバター:CTOのづやさん(AIアバター)に話をバトンタッチ
- づやさんのAIアバター:チームの取り組みや事例を解説
- 僕のAIアバター:締めの挨拶
記事冒頭でご説明した通り、HeyGenにはさまざまな動画のテンプレートが用意されているので、一から作るよりもこれらのテンプレートを作るほうが楽です。

編集画面の構成は、左側が各スライドの「トークスクリプト」の入力欄で、ここに打ち込むとその内容をAIアバターが読み上げてくれます。英語はもちろん、日本語や中国語、スペイン語など、基本的な言語はほぼ対応されています(音声生成AIの「Elevenlabs」のAPIに依存)。
右側がスライドのデザイン編集をする画面。GoogleスライドやPowerPointと同じように、直接テキストや配置・色を変えることができます。

デザインを決めながら、作った僕のAIアバターも挿入していきます。

AIアバターのづやさんも挿入します。

もちろん、画像や動画といった素材をアップロードすればスライドに挿入できます。こんな感じで動画を作っていけば完成です。
しゃべりのクオリティを上げるためのコツ
HeyGeで作る動画のクオリティを上げるためのコツがいくつかあるので、ご紹介します。
日本語特有の読み方に注意
たとえば、トークスクリプトにこのような文章を書き込むとします。
- こんにちは!
株式会社LIGのかけるです。本日はAI推進チームの取り組みについてお話しします!
実は僕は全てAIで作られたAIアバターです!
一見内容に問題はなさそうですが、このままAIに読み上げさせると、そもそも読み方が間違っていたり、イントネーションに違和感が残っていたりする場合があります。日本語特有の読み方やイントネーションに対して、まだ不安定な部分も多々あります。
生成結果に違和感があるときは、以下を変換して作ってみてください。
- 名前や企業名などの固有名詞(特に英語)は、カタカナに変換
- 英語をカタカナ読みに変換(例:「AI」→「エイアイ」「エエアイ」、「CEO」→「シイイイオウ」)
- 「ー」を母音で記載(例:「アバター」→「アバタア」、「チーム」→「チイム」)
- 勘違いしそうな漢字は、平仮名に変換
これを意識して作り直してみると、このようになります。
- こんにちは!
かぶしきがいしゃリグのかけるです。本日はエイアイ推進チイムの取り組みについておはなしします!
実は僕は全てエイアイで作られたエイアイアバタアです!
※太字が変更箇所
また、英語→カタカナ読みに変更しても、イントネーションの違和感が残る場合は、英単語に変換すると自然になります(例:「エイアイチーム」→「エイアイteam」、「エイアイアバタア」→「エイアイavatar」)。
このテクニックは、最近では「Sora2」のプロンプトテクニックでも効果的です。ぜひ覚えておいてください!
音声生成は納得がいくまで試す

ある程度スライドが完成したら、トークスクリプトに音声を入れていきます。
音声生成は毎回結果が微妙に違うので、納得がいくまで何度でも再生成しましょう。何度やっても納得いかない場合は、①を試行錯誤してみてください。
「ボイスディレクター」でトーンを調整する

ボイスディレクター機能を使うと、そのトークスクリプトを話すトーンを調整できます。
「Funny」「Cool」「Calm」といった選択肢があるのでそれを選ぶか、もしくは直接トーンの指示を出すことができます。動画のテーマやトンマナに合わせて作ってみましょう。
「Voice Mirroring」で(直接)トーンを調整する

ボイスディレクターの他にも、その場で音声を録音することで、話すトーンを調整する「Voice Mirroring」も便利です。
ボイスディレクターで思い通りの生成結果がなかなか出ないときは、Voice Mirroringfで自分のイメージを直接吹き込んで調整することもできます。
完成後も手軽にブラッシュアップできる!
HeyGenは、制作して終わりではなく、公開後のブラッシュアップができるのも魅力。
たとえば……
- トークスクリプトをあとから変更する
- 即座に多言語対応する
- 話している人物(AIアバター)を変更する
といった従来の動画制作では絶対に不可能だったことが実現できるようになるので、マーケティングや研修領域の動画制作の可能性が広がる方法だと思います。
ぜひお試しください!
HeyGenなどのAIツールを使いこなすために
日々雨後の筍のように、さまざまなAIツールが生まれるなかで、どのAIツールが使いやすいのか、自社にもっとも適しているのか、どう使いこなすのか、迷う場面もまだまだあると思います。
僕たちLIGの「AIコンサルティングサービス」では、長期的な貴社のパートナーとして、伴走しながら、AIを活用した社内業務の効率化やAIツール選定、導入支援を行っております。
「生成AIについて社内で理解を深めたいけど、どう進めていいかわかない」「生成AIの業務効率化について具体的な事例やアドバイスが欲しい」「生成AIを活用したプロダクトを開発したい」などご興味のある企業さまは、下記ページからお気軽にご相談ください。