728x90
반응형
예제 : 영화 자막 SRT문서에서 script만 남기기
import re
# 예시 문자열
text = """
24
00:01:24,519 --> 00:01:26,470
we avoid a fight.
25
00:01:26,471 --> 00:01:28,406
No one else dies.
26
00:01:31,410 --> 00:01:33,360
Okay.
"""
# 정규표현식 Regular Expression, regex, regexp : 문자열의 패턴을 나타내기 위한 형식 언어
# re.compile()은 정규표현식을 미리 컴파일하여 정규표현식 객체를 반환하는 함수
# re.sub(pattern, replacement, string)
pattern = re.compile(r'\d+\n\d{2}:\d{2}:\d{2},\d{3} --> \d{2}:\d{2}:\d{2},\d{3}')
result = re.sub(pattern, '', text)
# 여러 개의 연속된 빈 줄을 하나의 빈 줄로 대체
result = re.sub(r'\n\s*\n', '\n\n', result)
# 결과 출력
print(result)
출력>
we avoid a fight.
No one else dies.
Okay.
728x90
반응형
'코딩 수업 > 파이썬' 카테고리의 다른 글
[파이썬] 영화자막에서 대사만 남긴 결과값을 넣은 txt 파일의 이름을 코드 실행 시마다 새로 지정하기 (1) | 2024.01.29 |
---|---|
[파이썬] 영화 자막에서 대사만 남긴 결과값을 txt 파일로 저장하기 (0) | 2024.01.29 |
[파이썬] 자막 파일에서 대사만 남기기 예제 Python Example : Extracting Only Dialogue from Subtitle Files (1) | 2024.01.28 |
[파이썬] 특정 글에서 특정 기호 제거하기 (정규표현식, sub, strip) (0) | 2024.01.28 |
[파이썬] 글에서 특정 문자열을 특정 문자열로 변경하는 코드 (zip, for, replace) (업무 자동화) (0) | 2024.01.28 |