본문 바로가기

Python6

[ Python ] TextBlob을 이용한 영어 형태소 분석 해보기 TextBlob을 활용한 영어 문장의 형태소 분석영어 문장을 분석하려면 텍스트 데이터를 분해하여 단어와 품사 정보를 파악하는 것이 중요합니다. TextBlob은 Python으로 작성된 간단하고 강력한 자연어 처리 라이브러리로, 영어 텍스트 분석에 매우 유용합니다. 이번 글에서는 TextBlob을 사용하여 영어 문장의 형태소 분석을 하는 방법을 단계별로 설명하겠습니다. 다만, 들어가기 전에 말해둘 점은 TextBlob은 약간 학습적인 면에 포커싱 되어있다고 합니다. 따라서 대용량 데이터 처리에는 부족한 부분을 보여준다는데, 저는 아직 초기 단계라 성능적인 면에서 부족함을 느껴보지 못했다는 점을 미리 말씀드립니다..목차필요한 라이브러리 설치TextBlob 설치NLTK 데이터 다운로드영어 문장의 형태소 분석 .. 2025. 2. 9.
[ Python ] 일본어 형태소 분석기 MeCab을 설치해보자 [Python] 일본어 형태소 분석기 MeCab 설치하기일본어 자연어 처리에 필요한 MeCab 형태소 분석기를 Python에서 사용하기 위한 설치 과정을 끄적여 보겠습니다.. MacOS에서는 딸깍딸깍으로 쉽게 했는데 윈도우 환경은 조금 번거롭네요 ㅠㅠ1. 설치 파일 다운로드MeCab을 윈도우에서 사용하기 위해서는 먼저 설치 파일을 다운로드해야 합니다.MeCab 다운로드 링크:https://github.com/ikegami-yukino/mecab/releases/tag/v0.996에서 **mecab-0.996-64.exe**를 다운로드합니다.설치 파일: mecab-0.996-64.exe설치 파일을 다운로드한 후 실행하여 MeCab을 설치합니다. 기본 경로로 끄적끄적 하셔야 편해요!!2. 설치 및 환경 변수.. 2025. 2. 9.
[Python] CharacterTextSplitter의 chunk_size와 chunk_overlap의 동작 과정 CharacterTextSplitter텍스트를 separator단위로 자릅니다.각 잘린 부분이 chunk_size를 넘지않으면 합쳐집니다.separator가 없다면, chunk_size를 초과해도 잘리지 않고 하나의 chunk로 생성됩니다.hp_book = "123 234 567 8 9123456"text_splitter = CharacterTextSplitter( separator=" ", # 공백 기준으로 나누거나 적절히 설정 chunk_size=10, chunk_overlap=0, length_function=len_func)para_list2 = text_splitter.split_text(hp_book)print(para_list2)스텝1 separator 단위로 나눈다p.. 2024. 12. 15.
[ Python ] py-hanspell 맞춤법 검사기 오류 ( result 오류, json.loads 에러 ) 설치pip install git+https://github.com/ssut/py-hanspell.git 테스트 코드 수행from hanspell import spell_checker# 맞춤법 검사할 텍스트를 입력하세용text = "안녕 하세요. 만나서 반갑 습니다."try: # 맞춤법 검사 수행하는 메소드 result = spell_checker.check(text) print("Checked Text:", result.checked) # 수정된 텍스트 print("Original Text:", result.original) # 원본 텍스트 print("Errors Found:", result.errors) # 발견된 오류 수 print("Corrections.. 2024. 11. 6.
[ Python ] PyTorch Error : shm.dll not found OSError: [WinError 126] 지정된 모듈을 찾을 수 없습니다......\Python312\site-packages\torch\lib\shm.dll" or one of its dependencies.  잘되던게 .. 안되고 있다.. 진짜로 어제까지는 잘 됐다,, 해결책은 간단하다. PyTorch 팀에서 대응책을 제시해주었다.Init.py를 조금 손보면 된다.  이런 에러가 떴다면, __init__.py를 타고 들어가주자. 67줄 라인의 부분을 다음과 같이 수정해주자. 그럼 바로 오류가 해결되는 모습을 볼 수 있을것이다.    [ 참조 ]https://github.com/pytorch/pytorch/commit/fdfef759a676ee7a853872e347537bc1e4b51390 2024. 5. 20.
Python에서 GPT API를 사용해보자 - 1 Step1. API Key 발급받기2. 기본 설정3. API 사용하기4. 결과 확인    1. API Key 발급받기https://platform.openai.com/docs/overview 해당 사이트에 방문하여 줍니다.   프로젝트 API 키를 생성하셔도 좋고, 유저 API 키를 생성하셔도 사용이 가능합니다. 단, OpenAI는 프로젝트 API Key를 사용 권장합니다. 키를 생성하면, 해당 창이 뜹니다." 주의 " 해당 창을 벗어나면, 두 번 다시 API키를 조회할 수 없습니다.  이렇게 정상적으로 생성된 모습을 확인할 수 있습니다.   2. 기본 설정 및 셋팅pip install python-dotenvpip install openai일단, 해당 패키지들을 install 해줍니다. ( 사실 뭔가 .. 2024. 5. 16.