# V1 Spec ## 목표 영어 학습용 3분 영상 1개를 안정적으로 생성한다. ## 콘텐츠 형식 - 기본독백형 - 여자 화자 1명 - 기초 영어 회화 학습용 - 자연스러운 경험담/일상 독백 기반 ## 산출물 1. script.txt 또는 script.json 2. narration audio file 3. subtitle file (.srt) 4. final video (.mp4) ## 권장 파이프라인 1. topic 입력 2. script 생성 3. TTS 요청용 텍스트 생성 4. 음성 파일 수신 5. 자막 생성 6. 배경 영상/이미지와 합성 7. 최종 mp4 출력 ## script 기본 구조 - intro - main point 1 - main point 2 - main point 3 - closing ## 영상 스타일 가정 - 3분 분량 - 문장 단위 자막 - 음성 중심 - 과도한 효과 없이 깔끔한 학습형 템플릿 ## 보류 사항 - 세로형/가로형 최종 확정 - 자막 언어: 영어만 / 영어+한국어 - 배경: 단색 / 루프 영상 / 템플릿 디자인 - TTS API 인증 방식