반응형
https://www.lfd.uci.edu/~gohlke/pythonlibs/#jpype 에서 JPype1-1.2.0-cp38-cp38-win_amd64.whl을 download합니다. (최신버전 있으면 써도 상관 없습니다.)
파이참에서 Teminal로 들어가 설치해줍시다.
- pip install JPype1-1.2.0-cp38-cp38-win_amd64.whl
- pip install konlpy
주의할 점은 다운 받은 파일하고 Teminal 경로하고 같아야합니다 저는 이미 깔려있어가지고 저 모양인 거지 경로를 일치시켜주세요
# 본 프로그램은 텍스트 데이터를 빈도 분석하기 전 기초편입니다.
# 작성자 이성재
# 프로그램 wc_base03.py
# 코엔엘파이 라이브러리는 다른 라이브러리에 비해 설치가 조금 까다로운 편이며
# 설치가 정사적으로 되었으면 형태소 분리를 테스트한다.
from konlpy.tag import Twitter
twitter = Twitter()
sentance = '아버지가 방에 들어 가신다.'
tagging = twitter.pos(sentance)
print(tagging)
'''
출력 :
[('아버지', 'Noun'), ('가', 'Josa'), ('방', 'Noun'), ('에', 'Josa'), ('들어', 'Verb'), ('가신다', 'Verb'),
('.', 'Punctuation')]
'''
# 단어 뭉치가 리스트(배열)로 들어있을 경우
title_list = [
'인천시 연수구 , 을 강연 ICLC 성공개최..지역 10개 대학 간담회',
'인천일보 대표 고통안전 챌린지 동참',
'안산대, 2021년도 인천 경기북부 총장협의회 개최'
]
twitter = Twitter()
sentences_tag = []
# 형태소 분석하여 리스트에 넣기
for sentence in title_list :
word = twitter.pos(sentence)
sentences_tag.append(word)
print(word)
'''
출력 :
[('인천', 'Noun'), ('시', 'Noun'), ('연수구', 'Noun'), (',', 'Punctuation'), ('을', 'Josa'), ('강연', 'Noun'),
('ICLC', 'Alpha'), ('성공', 'Noun'), ('개최', 'Noun'), ('..', 'Punctuation'), ('지역', 'Noun'), ('10', 'Number'),
('개', 'Noun'), ('대학', 'Noun'), ('간담', 'Noun'), ('회', 'Noun')]
[('인천', 'Noun'), ('일보', 'Noun'), ('대표', 'Noun'), ('고통', 'Noun'), ('안전', 'Noun'), ('챌', 'Verb'), ('린지', 'Noun'),
('동참', 'Noun')]
[('안산대', 'Noun'), (',', 'Punctuation'), ('2021년', 'Number'), ('도', 'Foreign'), ('인천', 'Noun'), ('경기', 'Noun'),
('북부', 'Noun'), ('총장', 'Noun'), ('협의', 'Noun'), ('회', 'Noun'), ('개최', 'Noun')]
'''
Twitter()에 해당하는 객체를 만들어줍니다 twitter.pos(형태소 분석할 문장) 이러면 알아서 분류해줍니다
반응형
'[Big Data]' 카테고리의 다른 글
[BigData] 빅데이터 빈도분석을 WordCloud로 표현해보기 (0) | 2021.07.24 |
---|---|
[BigData] 빅데이터 동적 크롤링 Selenium4 (Chrome Driver, XPath) (0) | 2021.07.23 |
[BigData] 빅데이터 Beautiful Soup 할리스매장 크롤링하기(CSV로 저장해보기) (0) | 2021.07.23 |
[BigData] 빅데이터 정적 크롤링(BeautifulSoup) (0) | 2021.07.23 |