본문 바로가기
728x90
반응형

전체 글254

[파이썬] 영화자막에서 대사만 남긴 결과값을 넣은 txt 파일의 이름을 코드 실행 시마다 새로 지정하기 예제 : 영화자막 파일에서 대사만 남긴 것을 txt 파일로 저장하고 실행 시마다 파일 이름을 새로 지정하기 import re #datetime 모듈에서 datetime 클래스 가져옴 from datetime import datetime def subtitle(input): # 시간 정보를 가지고 있는 행을 제거 time = re.compile(r'\d+\n\d{2}:\d{2}:\d{2},\d{3} --> \d{2}:\d{2}:\d{2},\d{3}') result_text = re.sub(time, '', input) # 태그와 하이픈(-) 제거 result_text = re.sub(r'|-', '', result_text) # 여러 개의 연속된 빈 줄을 하나의 빈 줄로 대체 result_text = re.. 2024. 1. 29.
[파이썬] 영화 자막에서 대사만 남긴 결과값을 txt 파일로 저장하기 예제 : 영화 자막 파일에서 대사만 정리한 결과값을 txt 파일로 저장하기 import re def subtitle(input): # 시간 정보를 가지고 있는 행을 제거 time = re.compile(r'\d+\n\d{2}:\d{2}:\d{2},\d{3} --> \d{2}:\d{2}:\d{2},\d{3}') result_text = re.sub(time, '', input) # 태그와 하이픈(-) 제거 result_text = re.sub(r'|-', '', result_text) # 여러 개의 연속된 빈 줄을 하나의 빈 줄로 대체 result_text = re.sub(r'\n\s*\n', '\n\n', result_text) return result_text.strip() # 사용 예시 ori = ".. 2024. 1. 29.
[파이썬] 자막 파일에서 대사만 남기기 예제 Python Example : Extracting Only Dialogue from Subtitle Files 예제 : 영화 자막 파일에서 대사만 남기고 정리하기 import re def subtitle(input): #시간 정보를 가지고 있는 행을 제거 time = re.compile(r'\d+\n\d{2}:\d{2}:\d{2},\d{3} --> \d{2}:\d{2}:\d{2},\d{3}') result_text = re.sub(time, '', input) # 태그와 하이픈(-) 제거 result_text = re.sub(r'|-', '', result_text) # 여러 개의 연속된 빈 줄을 하나의 빈 줄로 대체 result_text = re.sub(r'\n\s*\n', '\n\n', result_text) return result_text.strip() # 사용 예시 ori = """ 4 00:00:09,.. 2024. 1. 28.
[파이썬] 특정 글에서 특정 기호 제거하기 (정규표현식, sub, strip) 예제 : 특정 글에서 , , - 기호를 제거하기 import re # \/는 / 문자를 이스케이프하기 위한 것으로, ?는 0회 또는 1회의 발생 def removal (input): result = re.sub(r'|-', '', input) return result.strip() # 사용 예시 ori= """ - What do you think? - Let's go.""" clean = removal(ori) print(clean) 출력> What do you think? Let's go. 2024. 1. 28.
728x90
반응형