Just tested the newly released VACE model (WAN2.1-VACE-14B) by WAN on May 15, focusing on the “Anime character dance generation” feature. I ran it on ComfyUI with an RTX4090, outputting a 512×896, 16-frame, 4-second video — took about 20 minutes to render.
Three difficulty levels:
🟢 Easy – simple gestures like waving and shrugging
🟡 Medium – dance movements inspired by The Nutcracker
🔴 Hard – complex ballet sequences from Swan Lake
Everything worked surprisingly well except for the most challenging Swan Lake moves. Motion was smooth, and the physics for hair and clothing were quite impressive. No major clipping, and even small details like pant seams and shoelaces were nicely preserved.
I deliberately used loose-fitting outfits, and the results were satisfying. The only downside is the hardware limit — can’t push to higher resolutions yet. Really hope WAN brings this to the http://wan.video platform soon so we can all create without GPU bottlenecks 🙏
2025.05.15
微細な表情やジェスチャーが追加され、アバターの自然さと表現力が大きく向上しています。
最大60秒の動画をデフォルトでもサポートしており、ワークフローの効率化にもつながりそうです。
AI生成ツールとしての進化を感じられるアップデートでした。@HeyGen_Official
動画の冒頭10秒は英語、後半10秒は日本語で構成しています。
veo3の群衆戦闘シーン処理能力を検証
「veo3の群衆戦闘シーン処理能力を検証」
主人公の動きとポーズは全体的に安定しており、アクションも滑らか。敵キャラクターには若干のブレや変形が見られるが、基本的な隊列は維持されている。
エフェクト表現もおおむねプロンプト通りに反映されている。出力解像度は720p。アップスケーリング中にエラーが発生した。
Charge forward
2025.05.28
#AI動画定点観測 第2弾|「ドラゴンよ、女王のチェス盤を焼き払ってしまえ」今回テストに参加したモデルは以下の通りです:Kling 2.0 Master/Vidu Q1/ Runway Gen-4/ Luma Ray2/ WAN 2.0 Plus 😋
📋 テスト内容:
共通のプロンプトと1枚の画像を使用し、各モデルに2回ずつ生成機会を与え、出力された動画はいずれも5秒です。
今回のテーマは:「ドラゴンが女王のチェス盤を焼き払う」。
プロンプトに含まれる重要な要素:
1 カメラがゆっくり左に回転しながら女王へズームイン
2 女王がチェス盤から駒を手に取る
3 ドラゴンが炎を吐き、チェス盤が炎に包まれる
まず第一に、さすがは精鋭5モデル。たった2回の生成でも、編集とポストプロダクションを加えることで、十分に実用レベルの映像に仕上がりました。🫶
次に、いくつかの注目すべき特別な挙動や特徴的な表現についてご紹介します。
ドラゴンは「口」から炎を放つが成功したモデル:
✅ Kling 2.0 Master
✅ Runway Gen-4
✅ WAN 2.0 Plus
✅ Luma Ray2
「女王が駒を手に取る」動作を再現できたモデル:
✅Kling 2.0 Master
✅Runway Gen-4
最も感情表現ができたモデル:
✅ WAN 2.0 Plus(「驚きの表情」が見られた)
最もドラマチックなサプライズ:
✅Vidu Q1(最後、ドラゴンが女王にキス)
カメラワークが最も安定・美しかったモデル:
✅ Kling 2.0 Master
✅ Runway Gen-4
✅ Luma Ray2
女王に被害なし:
✅ Luma Ray2
✅ Runway Gen-4
✅ Vidu Q1
🧩 総括と所感:
AI動画生成は、今やまるで「ガチャ」のよう。プロンプト、初期画像、プラットフォームの性能、編集スキル、そして……運と資金力が試される世界です。
私自身のリソースには限りがあるため、大規模な検証は難しく、あくまで一人のクリエイター視点での観察と記録となります。参考程度にご覧ください。
それでも、はっきり言えるのは:
たった2ヶ月前のテスト時と比べて、モデルの進化スピードは目を見張るものがある。
自分自身も含め、まるでタイムマシンに乗って未来を走っているような感覚です。
📅 今後について
私は今後も、月1回のペースでAI動画モデルの定点観測テストを続けていく予定です。 #AI動画定点観測 #Kana_AITest
この激変する世界を一緒に見届けたい方、ぜひフォローしてください。
私たちは今、創造と進化の最前線にいます。
#AIVideo #KlingAI #Vidu #RunwayML #LumaAI #WAN #DreamMachine
#生成AI #AIart #AIモデル比較 #kanaworksai
2525.05.09
SkyReels CPPになりました~!🎉 @SkyReels
最初に挑戦したのは、キャラLoRAのトレーニング。勇者にゃんこ 🐱⚔️ を育ててみました。15枚の画像+約7時間の学習で、想像以上にいい仕上がりに!
今回はいろいろ学びもあって、「素材少なすぎたかも…」「スタイル偏ったなぁ」とちょっと反省
もし動画で学習させたらもっと良くなるのかな?なんて思ったりもしてます。次に挑戦するときは、もう少し賢くなってる…はず!(笑)
チュートリアルは動画後半にまとめてあるので、よければぜひご覧ください~
2025.05.27
画像のみ対応から進化し、今回のアップデートでは 最大10秒の動画 にも対応しています。さまざまなクリエイティブ用途に活用可能です。主な機能
・画像・動画の拡張に対応(動画は最長10秒)
・拡張する時間範囲を選択可能(Trim 機能)
・初期フレームを 同時に4枚生成、完成品質の確認に有効
・解像度アップスケール対応(1080p / 4K)
・アスペクト比を自由に変更可能(9:16、3:4、1:1、4:3、16:9、21:9)
→ 横長・縦長の制限を超えて表現が可能に
使用感
・操作はシンプルで、AI が自動的に画面外を補完
・SNSや映像制作でのフォーマット変換に便利
・初期フレームはランダム生成のため、「さっきの方が良かったかも」となるケースが多い
→ 提案:気に入ったフレームを「ピン留め」できる機能があれば、再生成時のストレスを軽減できる
@LumaLabsAI
#AIart #AIVideo #DreamMachine #Ray2 #Reframe
#kanaworksai #Kana_AITest
2025.05.10
HeyGen_Official
のAI音声合成とリップシンク機能を試してみましたが…これはすごい!
唇の動きは自然で「貼り付き」もなく、発声時の呼吸による胸の動きまで細かく再現されていて、リアルさにびっくり✨まさに“掘り出し物”を見つけた気分です。
実際の使用サンプルをご覧ください(5秒後に使い方のチュートリアルもつけています。気になる方はぜひ!)
#AIart #AIVideo #kanaworksai
#AI活用 #リップシンク #実用AIテク
#AITools #Voiceover #LipSync #HeyGen