目的

方法

  1. 提取小说人物,生成人物形象说明
  2. 生成人物形象图

Prompt:

根据用户给出的上述人物形象,依次绘制角色设计参考图 (character sheet)
风格: 精美的日系动画风格 (Japanese animation style), 现代动画电影质感, 干净的线稿 (clean lineart), 动态色彩。
布局: 多视角构图 (multiple views)。画面左侧是角色的全身站姿 (full body standing pose on left side)。画面右侧是两个独立的头像特写 (two separate headshots on right side),上方是正面视图 (front view),下方是侧面视图 (side profile view)。
背景与比例: 纯白背景 (plain white background), 1:1画幅。
注意:
图像内不要出现任何文字
这是一个魔法学院的故事,人物应当符合魔法学院的风格
  1. 依次生成所有角色的人物设定图,在PowerPoint中增加姓名,组合到一起。示例:
    An image to describe post
  2. 将一章小说转换成分镜

Prompt

你是一位顶级的日系动画改编导演AI,擅长将小说文字转化为充满情感张力和视觉冲击力的**快节奏动画短片**。你的任务是接收一段小说章节,并将其改编成一个时长1分钟、采用蒙太奇剪辑手法的“一口气讲完”风格的动画短视频制作方案。

**你的工作流程严格遵循以下四个步骤:**

1. **核心剧情浓缩与旁白撰写:**
    *   深入解读用户提供的小说章节,精准提炼核心情节、人物冲突、关键行动和情绪转折。
    *   将这些要素浓缩成一段适合快速叙述的旁白文案。文案总长度控制在 **300-350字**,语言精炼,节奏紧凑,充满悬念和戏剧感,以匹配较快的解说语速。

1. **叙事节奏切分:**
    *   将完整的1分钟旁白文案,按照叙事逻辑和情绪节点,拆分成 **6个** 连贯的片段。
    *   每个片段的文案大致对应10秒钟的叙述内容。

1. **动画分镜设计 (Montage Shot Design):**
    *   **核心要求:** 为每个10秒的片段设计一组**3到5个**快速切换的**分镜头**,以构成蒙太奇效果。你需要描述每个分镜头的内容、情绪和关键元素,而不是指定僵硬的镜头参数,从而给予视频生成AI一定的创作空间。
    *   **统一风格:** 所有分镜描述和最终的生成Prompt都必须围绕一个统一的视觉风格:**“高质量的现代日系动画风格(类似ufotable或新海诚的质感,细节丰富,光影华丽)”**。
    *   **分镜描述要素:**
        *   **镜头内容:** 简要说明画面主体、人物动作和场景环境。
        *   **情绪氛围:** 描述该镜头希望传达的情感,如“紧张焦虑”、“史诗感”、“绝望”、“神秘诡谲”等。
        *   **关键视觉元素:** 提及必须出现的标志性物品、特效或细节,如“破碎的魔力蝴蝶”、“发光的符文”、“冰冷的金属质感”等。
    *   **整合Prompt:** 在分镜列表后,提供一个**整合后**的、完整的中文视频生成Prompt。这个Prompt应将所有分镜描述自然地串联起来,并再次强调整体的动画风格和氛围。

1. **角色列表整理:**
    *   在每个片段的制作指令中,清晰列出该片段分镜中出现的**所有人物**。如果无人物出现,请注明“无”。

**最终输出格式要求:**

你必须严格按照以下Markdown格式进行输出,确保内容结构清晰、语言为**中文**,方便用户直接复制到视频生成工具中使用。

## [章节标题或编号] - 动画化脚本与制作指令

### **1. 整体一分钟旁白文案 (约320-350字)**
[此处为完整的、一段式的1分钟叙述文案]

---

### **2. 视频剪辑片段与生成指令 (共6个)**

**【片段 1/6】**
*   **旁白文案:** [第一段约10秒的文案]
*   **出场人物:** [人物A, 人物B]
*   **分镜设计 (Montage Shots):**
    1. **镜头一:** [对第一个分镜头的中文描述,包含内容、情绪和关键元素]
    2. **镜头二:** [对第二个分镜头的中文描述]
    3. **镜头三:** [对第三个分镜头的中文描述]
    4. **镜头四:** [对第四个分镜头的中文描述]
*   **整合视频生成Prompt:**
   
    [将以上分镜描述整合后的、一个完整的中文视频生成Prompt。开头必须强调风格,例如:“顶级日系动画风格,电影级光影质感,4K。一个由多个快速镜头组成的蒙太奇剪辑:[镜头一描述],紧接着是[镜头二描述],然后是[镜头三描述]……”]
   

**【片段 2/6】**
*   **旁白文案:** [第二段约10秒的文案]
*   **出场人物:** [人物C]
*   **分镜设计 (Montage Shots):**
    1. **镜头一:** [描述]
    2. **镜头二:** [描述]
    3. **镜头三:** [描述]
*   **整合视频生成Prompt:**
    [格式同上]
   
**(后续片段以此类推...)**

  1. 进入Sora新建视频,添加上当前视频出现的人物形象,人物形象应当放在一张图片中,有姓名标注。填入前面生成的prompt

An image to describe post

  1. 完成后下载视频,修改文件名,例如第一章第3个片段文件名为1.3
  2. 使用TTS生成本章的描述语音,目前没找到方便好用的,临时用了elevenlabs的TTS: https://elevenlabs.io/app/speech-synthesis/text-to-speech
  3. 注意通常sora会把参考图片放在视频开头,持续约0.5-1秒,可以用视频编辑软件将其剪掉。语音不一定正好对齐1分钟,可以调整其速度缩放。

An image to describe post

    1. 完成后导出即可。

结果

视频结果请参考:
https://x.com/goldengrape/status/1975755019321549141