본문 바로가기

아래아한글 자동화258

[pyhwpx] 스크립트매크로를 파이썬 함수로 바꿔주는 hwp.clipboard_to_pyfunc hwp.clipboard_to_pyfunc 를 설명하기 전에 먼저, 기존에 정의된 스크립트매크로를 한/글에서 직접 실행하는 명령어도 있기는 하다. 바로 hwp.run_script_macro라는 메서드인데, 사용법은 간단하다. hwp.run_script_macro("OnScriptMacro_중국어1성()") 방식으로 사용하면 된다. 대신 유의할 점은, 스크립트매크로 목록의 이름인 "중국어1성"이 아니라 소스코드의 함수명인 "OnScriptMacro_중국어1성()"을 입력해야 한다는 것이다. (괄호 포함) 그런데, 매크로는 수시로 녹화하는 관계로, 지워지거나 변경되는 경우가 잦다. 그래서 특정 매크로를 파이썬 코드로 만들어 두고 싶을 때가 있는데, 이 과정이 어려운 것은 아니지만, 번거롭고 귀찮다. 그래서 .. 2024. 2. 10.
[pyhwpx] 페이지별로 분할 저장하기 100장의 문서가 있다고 할 때 페이지별로 1.hwp, 2.hwp, ..., 100.hwp로 저장하는 예제를 진행해보자. 위 문서를 다운받은 후 해당 폴더에서 쥬피터노트북을 실행한다. (본 포스팅에서는 '바탕화면'이라고 가정) 아래 명령어를 실행한다. import os from pyhwpx import Hwp # 바탕화면으로 이동 os.chdir( os.path.join( os.environ["USERPROFILE"], "desktop") ) # 분할파일 저장할 폴더 생성 os.mkdir("result") # 원본문서 열기 hwp = Hwp() hwp.open("표창장100ea.hwp") # 한페이지씩 잘라서 저장하기 hwp.add_doc() # 새 문서 열림 hwp.switch_to(0) # 원본 문서.. 2024. 2. 10.
[pyhwpx] 한/글 문서의 수식 문자열 초간단 추출하기 아래아한글에는 고유의 수식 언어인 HwpEqn이라는 체계가 있는데 이게 써볼수록 진국이다. 가재가 게편이라 그런지, LaTeX과 유사한 듯 하면서도 HwpEqn이 더 간결하고 우월하다는 느낌도 든다. 하여튼, 어떤 분께서 한/글 개발자 포럼에 아래와 같은 질문을 남겨주셨다. 1. 기존의 오토메이션API를 사용하는 방식 기존 한/글 오토메이션API를 이용하여 문서 내의 모든 수식을 추출해 오는 (내가 아는 한 가장 간결한) 방법은 아래와 같다. """ 각 수식 밑에 수식String 삽입하는 코드 """ import os import win32com.client as win32 hwp = win32.gencache.EnsureDispatch("hwpframe.hwpobject") hwp.XHwpWindows.. 2024. 2. 1.
[pyhwpx] 한 줄의 코드로 자간자동조절 : auto_spacing 아래아한글 보고서 작성할 때, 자간 조절 작업만큼 사람 기빠지게 하는 작업이 또 있을까요ㅜ 맞아요. 힘들어서가 아니라, 자괴감이 들지요. HTML 삽입 미리보기할 수 없는 소스 격한 공감ㅜㅜㅜㅜㅜㅜㅜㅜㅜㅜㅜㅜㅜㅜㅜㅜ 윗분들은... 그냥 읽으시면 되는데, 외국인들은 자간조절 같은 거 안 하고 그냥 단어단어 끊어서 잘만 쓰던데.. "보기 좋다는" 보고서를 만들기 위해 자간조절 따위에 시간을 쓰고 있으면 정말 스트레스 받습니다. 팀장, 처장, 본부장, 사장이라는 사람들이 줄글에 단어 하나 끊어졌다고 문맥파악 못 하는 것도 아니고, 보고서 읽는 시간이 엄청 길어지는 것도 아닌데ㅜ 이상한 공무행정 관행이 우리나라에만 유난히 굳어져 있는 것 같아요. 그럼에도 하여튼, 이런 자간조절 작업 때문에 퇴근을 10분 더 늦.. 2024. 1. 26.
[pyhwpx] 폰트 설정을 위한 set_font 메서드 아래아한글의 글자모양은 제법 다양한 옵션들을 가지고 있습니다. 일반적인 보고서를 작성할 때 사용하는 글자크기(height), 위첨자와 아래첨자, 특별한 경우 글자색을 넣는 정도 외에도 다양한 글자모양 옵션을 아래와 같이 간단한 명령어를 조합하여 적용해볼 수 있습니다. hwp.set_font()의 파라미터 목록 Bold: 진하게 적용(True/False) DiacSymMark: 강조점(0~12) Emboss: 양각(True/False) Engrave: 음각(True/False) FaceName: 서체 이름 FontType: 1(TTF, 기본값) Height: 글자크기(pt, 0.1 ~ 4096) Italic: 이탤릭(True/False) Offset: 글자위치-상하오프셋(-100 ~ 100) OutLine.. 2024. 1. 26.
[pyhwpx] 한/글 자동화 문의 및 요청의 90%는 ㅇㅇ 관련이었어요. 안녕하세요? 일코입니다. 유튜브와 블로그를 운영하면서 받았던 문의 중 90%는 바로 "표"에 관한 내용들이었습니다. 표는 비단 행정뿐만 아니라, 한/글을 통해 작성되는 문서에서 가장 많이 쓰이는 컨트롤이죠. 그런데 기존의 한/글 오토메이션 API를 통해 표를 읽어오거나, 표를 작성하는 메서드는 다소 큰 진입장벽이 있었습니다. 예를 들어 비교적 최근 만든 pyhwpx에서 5행5열의 표를 만들고 "글자처럼 취급"을 적용하는 코드는 아래 세 줄이면 되지만, from pyhwpx import Hwp hwp = Hwp() hwp.create_table(5, 5, treat_as_char=True) 그런데, 기존 오토메이션API를 통해 동일한 표를 직접 생성하려면 무려 아래의 코드를 작성해야 합니다. (혹시 관심 .. 2024. 1. 25.
[pyhwpx] 파이썬 정규식으로 찾아바꾸기 pyhwpx.Hwp().find_replace_all(src, dst, regex=True) regex=True로 설정하면 re.sub와 동일한 방식으로 정규식 문법을 사용할 수 있다. 예를 들어 주민등록번호 패턴인 123456-1234567을 123456-1******로 변경하고자 하면, (여러가지 구현이 있겠지만) src = r"(\d{6})-(\d)\d{6}(?=\D|$)" dst = r"\g-\g******" hwp.find_replace_all(src, dst, regex=True) 라고 코드를 입력하고 실행해보자. 시연화면은 아래와 같다. 정규식 찾아바꾸기 시연화면 바뀌기 전의 원본문서는 아래와 같고 정규식 찾아바꾸기를 적용한 후의 문서는 아래와 같다. 메서드 내부에서는 re.sub를 사용하지.. 2024. 1. 23.
[크롤링 연계2] 보건소 정보로 한/글 파일 만들기 이전 포스팅에 이어, [크롤링 연계] 전국 보건소 정보 가져오기1 아래 코드를 주피터노트북에서 실행하면 질병관리청의 "전국 보건소 정보"를 엑셀로 저장한다.HTML 삽입미리보기할 수 없는 소스다음 포스팅에서는 이 엑셀파일을 한/글의 표로 옮겨보겠다. 미 martinii.fun 엑셀로 취합한 전국 261개 보건소 및 의료원 정보를 한/글 문서의 표로 생성하는 방법을 알아보자. 1. 그대로 집어넣기(세상 간편) 엑셀시트 그대로 삽입하는 방법이다. "보건소.xlsx" 파일이 저장된 위치에서 아래 코드를 실행하면, from pyhwpx import Hwp hwp = Hwp() hwp.table_from_data( "./보건소.xlsx", # 엑셀파일명 index=False, # 1열에 연번 추가안함 cell_f.. 2024. 1. 23.
[크롤링 연계1/2] 전국 보건소 정보 가져오기 feat.질병관리청 아래 코드를 주피터노트북에서 실행하면 질병관리청의 "전국 보건소 정보"를 엑셀로 저장한다. HTML 삽입 미리보기할 수 없는 소스 다음 포스팅에서는 이 엑셀파일을 한/글의 표로 옮겨보겠다. 미리 언급해 두는데, 한/글로 옮기는 코드는 짧다. 2024. 1. 23.