1. 프로젝트 개요
1-1. 프로젝트 개요
- 프로젝트 기간 : 2021-09-27 ~ 2021-10-07
- 프로젝트 주제
- 문장 내 개체간 관계 추출 : 문장의 단어(Entity)에 대한 속성과 관계를 예측하는 인공지능 만들기
1-2. 데이터 셋 및 평가 방법
wikipedia, wikitree, policy corpora 부터 얻은 데이터
- Train Set: 32,470 / Test Set: 7,765
- label: 30개의 class로 구성된 관계
- input:
sentence
subject_entity
object_entity
- output:
pred_label
, 각 class에 대한 확률 prods
- 평가방법
- no_relation class를 제외한 micro F1 score (1순위)
- 모든 class에 대한 area under the precision-recall curve (AUPRC) (2순위)
1-3. 활용 장비
- [OS] Linux version 4.4.0-59-generic
- [CPU / GPU] Intel(R) Xeon(R) Gold 5220 CPU @ 2.20GHz / Tesla V100-SXM2-32GB
- [협업툴] Git-hub / Slack / Notion / Wandb
- [IDE] VSCode / Pycharm / Jupyter lab