본문 바로가기
Python

[ Python ] 일본어 형태소 분석기 MeCab을 설치해보자

by YBin's 2025. 2. 9.

 


[Python] 일본어 형태소 분석기 MeCab 설치하기

일본어 자연어 처리에 필요한 MeCab 형태소 분석기를 Python에서 사용하기 위한 설치 과정을 끄적여 보겠습니다.. MacOS에서는 딸깍딸깍으로 쉽게 했는데 윈도우 환경은 조금 번거롭네요 ㅠㅠ

1. 설치 파일 다운로드

MeCab을 윈도우에서 사용하기 위해서는 먼저 설치 파일을 다운로드해야 합니다.

설치 파일을 다운로드한 후 실행하여 MeCab을 설치합니다. 기본 경로로 끄적끄적 하셔야 편해요!!


2. 설치 및 환경 변수 설정

2.1. MeCab 설치

  1. 설치 파일 실행:
    • 다운로드한 mecab-0.996-64.exe 파일을 실행하여 설치를 진행합니다.
    • 설치 경로는 기본적으로 C:\Program Files\MeCab에 설치됩니다. (경로는 선택 가능.. 하지만 위에서 언급했듯이 기본 경로가 편합니당)
  2. 사전 설치:
    • ipadic 사전이 기본으로 제공됩니다. 사전은 C:\Program Files\MeCab\dic\ipadic에 설치됩니다.
    • 사용자 정의 커스텀 사전을 추가할 수 있으나.. 아직 공부 전이기때문에 공부하면 추가 업로드 하겠습니다.

2.2. 환경 변수 설정

MeCab을 Python에서 제대로 사용할 수 있도록 환경 변수를 설정합니다.

  1. 시스템 환경 변수에 MECABRC 변수 추가:
    • MECABRC 변수의 값으로 C:\Program Files\MeCab\etc\mecabrc (실제 경로에 맞게 수정 해주세용) 설정합니다.
  2. Path 변수에 MeCab 경로 추가:
    • C:\Program Files\MeCab\bin 경로를 Path 환경 변수에 추가하여 mecab 명령어를 전역에서 사용할 수 있게 합니다.

2.3. Python에서 MeCab 설치

Python에서 MeCab을 사용하려면 mecab-python3 라이브러리를 설치해야 합니다. !! 

pip install mecab-python3

3. 테스트 코드 작동

MeCab이 제대로 설치되었는지 테스트하는 간단한 Python 코드를 작성합니다.

3.1. 테스트 코드

import MeCab

# MeCab 초기화 (사전 경로 명시 본인의 경로에 맞게 바꿔주세용)
mecab = MeCab.Tagger("-d \"C:/Program Files/MeCab/dic/ipadic\"")

text = "これはテストです。"

# 분석 결과 출력 찍어보기
result = mecab.parse(text)
print(result)

3.2. 실행 결과

정상적으로 작동하면 아래와 같은 형태소 분석 결과를 출력합니다:

これ    名詞,代名詞,一般,*,*,*,これ,コレ,コレ
は      助詞,係助詞,*,*,*,*,は,ハ,ワ
テスト  名詞,サ変接続,*,*,*,*,テスト,テスト,テスト
です    助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
。      記号,句点,*,*,*,*,。,。,。
EOS

4. 문제 해결

mecabrc 파일을 찾을 수 없는 오류가 발생할 수 있습니다..! 아래와 같은 에러가 떳다면 환경변수 에러에요!

------------------- ERROR DETAILS ------------------------
arguments: 
default dictionary path: None
[ifs] no such file or directory: c:\mecab\mecabrc
----------------------------------------------------------
  1. 경로 확인:
    • mecabrc 파일은 C:\Program Files\MeCab\etc\mecabrc에 있어야 합니다. 이전에 추가한 시스템 환경 변수가 올바른지 체크해주세욥.

이렇게 MeCab을 설치하고 Python에서 사용할 준비를 마쳤습니다. 이제 다양한 일본어 텍스트를 분석하고 자연어 처리 작업을 진행할 수 있습니다! 더욱 디테일한 점은 공부하면서 작업 내용을 기록해볼게요