YouTube Video Analyzer

2025. 3. 31. 18:58인공지능/플젝


Goal: Get subtitle from video and analyze.
model: Whisper, Pegasus, KeyBERT, BERT-NER, SpaCy
dataset:.
Tech stack: FastAPI, Celery, Redis, Tailwind.js, SQLite, transformer, ffmpeg

videopy로 영상 다운로드.
Whisper로 해당 영상의 자막 추출.

ffmpeg로 소리 시작점 재추출.
SQLite에 영상정보와 자막 내용 뽑아 DB화.
srt로 영상과 자막 합침.
KeyBERT로 키워드 추출(all-MiniLM-L6-v2).
BERT(bert-base-NER)와 SpaCy로 NER 추출한 뒤 교집합 값만 산출.

Pegasus로 영상의 자막 요약(google/pegasus-cnn_dailymail).

 

 

 

 

 

 

 

 

 

 

 

728x90

'인공지능 > 플젝' 카테고리의 다른 글

Furniture retrieval  (0) 2025.01.29
Sceneary image generation  (0) 2024.12.27
Car Damage Detection  (1) 2024.12.09