728x90
반응형
>> 기능추가
1. srt 파일 경로만 입력해도 됨
2. 저장명에 영화제목 들어가게
>> 자막 파일로 깔끔하게 대사만 추출해주는 프로그램 for 미드 쉐도잉
import re
from datetime import datetime
import os
def subtitle(input):
# HTML 태그 제거
input = re.sub(r'<.*?>', '', input) # 모든 HTML 태그를 제거하는 정규식
time = re.compile(r'\d+\n\d{2}:\d{2}:\d{2},\d{3} --> \d{2}:\d{2}:\d{2},\d{3}')
result_text = re.sub(time, '', input)
result_text = re.sub(r'<\/?i>|- ', '', result_text)
result_text = re.sub(r'\n\s*\n', '\n\n', result_text)
return result_text.strip()
def extract_movie_name(srt_filename):
# 경로를 제외하고 파일 이름만 추출
movie_name = os.path.basename(srt_filename).split('.')[0] # 경로 제거 후 파일 이름만 추출
return movie_name
def process_srt_file(srt_filename):
# SRT 파일 읽기
with open(srt_filename, 'r', encoding='utf-8') as file:
content = file.read()
# 텍스트 추출
result = subtitle(content)
# 영화 이름 추출
movie_name = extract_movie_name(srt_filename)
# 결과 파일로 저장 (경로와 파일 이름 지정)
output_folder = r"결과저장경로" # 원하는 저장 폴더
output_filename = os.path.join(output_folder, movie_name + "_ShadowingScript.txt") # 파일명: movie_name_ShadowingScript.txt
with open(output_filename, 'w', encoding='utf-8') as file:
file.write(result)
print(f"결과가 '{output_filename}' 파일에 저장되었습니다.")
# SRT 파일 경로 (실제 경로로 수정 필요)
srt_file = r"srt파일경로" # 실제 SRT 파일 경로를 넣으세요
process_srt_file(srt_file)
>> 결과

728x90
반응형