반응형
키워드
- 우아한 테크코스 자소서 작성, 자바 형태소 분석 nlp 라이브러리 구현, SWEA
배운 내용
자바 형태소 분석 nlp
// 저장소
repositories {
maven { url 'https://jitpack.io' }
}
// KOMORAN 라이브러리
implementation 'com.github.shin285:KOMORAN:3.3.4'
- komoran 라이브러리를 build.gradle에 작성해준다.
@Configuration
public class KomoranConfiguration {
@Bean
public Komoran regsiterKomoranBean(){
return new Komoran(DEFAULT_MODEL.FULL);
}
}
- Komoran 객체를 Bean으로 등록해준다. (DEFALUT_MODEL.FULL, LIGHT가 존재하며 LIGHT는 경량형이다.)
@Override
public List<String> extractNoun(String text) {
logger.info("형태소 분석을 시작합니다.");
logger.info("input : " + text);
text = removeSpecialCharacters(text);
logger.info("특수문자 제거 및 앞뒤 공백 제거 : " + text);
KomoranResult analyzeResultList = this.komoran.analyze(text);
List<String> result = analyzeResultList.getNouns();
logger.info("result : " + result);
return result == null ? new ArrayList<>() : result;
}
public String removeSpecialCharacters(String text){
return text.replace("[^가-힣a-zA-Z0-9", " ").trim();
}
- 이 모델을 사용해서 명사의 빈도수나, 명사를 추출할 수 있으며 나는 프로젝트에서 명사 추출 기능을 사용하기 위해서 사용하였다.
SWEA
반응형
'TIL' 카테고리의 다른 글
[ 24. 10. 18 ] (0) | 2024.10.18 |
---|---|
[ 2024. 10. 10 ] (1) | 2024.10.11 |
[ 2024. 10. 05 ] (0) | 2024.10.05 |
[ 2024. 10. 04 ] (0) | 2024.10.04 |
[ 2024. 10. 03 ] (0) | 2024.10.04 |