수화 영상 : 손짓 ,눈짓

https://www.youtube.com/watch?v=3esOubx5l4U

0. Abstract


수화는 언어학적 특징(linguistical property)을 가지고 있기 때문에, NLP의 도구나 이론이 유효할 것으로 예상한다. 그러나 기존의 SLP 에선 좀처럼 수화의 언어학적 특징을 연구하거나 활용하려 하지 않았다. 위 논문은 기존 SLP model의 한계를 알아보고, NLP 를 수화까지 확장해 볼 것이다. 최종적으로 우리는 아래 4가지를 촉구한다.

(1) the adoption of an efficient tokenization method (효율적인 토큰화 방식 채택)

(2) the development of linguistically-informed models (언어학에 정통한 모델의 발전)

(3) the collection of real-world signed language data ( 실제 수화 데이터 수집)

(4) the inclusion of local signed language communities as an active and leading voice in the direction of research. (수화 관련 단체들의 활발한 연구)

1. Introduction


스크린샷 2021-09-12 오후 11.44.30.png

2. Background and Related Work

2.1 History of Signed Languages and Deaf Culture

2.2 Sign Language Processing in the Literature

3. Sign Language Lingusitics

Phonology (음운 체계)

Simultaneity (동시성)

Referencing

Fingerspelling

4. Current state of SLP

4.1 Representations of Signed Languages

스크린샷 2021-09-13 오후 2.11.00.png

  1. Videos

    SL 의 가장 직설적인(straightforward) 표현이며 , 상세하게(amply) 그 의미를 전달할 수 있다. 다만, 차원이 크다는 단점(drawback)이 있다. 큰 차원으로 인해 저장 , 전달, 인코딩하기에 비용이 비싸다. 또한 수화에서 표정은 중요한 요소인데 초상권 문제로 동영상 데이터는 public data로 쓰기엔 제한된다.

  2. Poses

    비디오의 시각적 요소를 줄여서 선구조(꼭짓점 연결한 구조)로 바꿔준다. 모션 캡처가 때론 더 좋기도 하지만 장비가 비싸고 , 현재는 비디오를 통한 방법이 더 선호되고 있다.

    비디오보다 복잡도도 낮고 초상권 문제도 없고(annoymized) 정보 손실도 적다. 그러나! 대부분의 NLP 모델에선 연속적인 2차원 표현은 사용되지 않는다는 한계가 있다.

  3. Written notation systems

    비연속적이며 2차원 문자. 많은 표기법이 제안되었지만, 수화 커뮤니티에서 널리 채택된 건 없다. 표준이 없다보니 데이터를 표준화하거나 프로젝트에 적용하기가 힘들다.

  4. Glossing

    sign이 고유의 식별자를 가질 때, sign-by-sign을 각각 하나의 의미로 표기하는 것.

    linear gloss annotation 또한 부정확한 표기이며 , 동시에 다른 단서(cues)를 표현할 수 없다.

    SLP의 다운스트림 테스크에 활용하기엔 정보 손실이 불가피하다.

4.2 Existing Sign Language Resources

스크린샷 2021-09-13 오후 4.11.48.png

다른 형태의 resources들을 살펴보며 어떻게 그것들을 SL modeling에 적용할 지 얘기해보자.

4.3 Sign Language Processing Tasks

스크린샷 2021-09-13 오후 4.13.25.png

5. Towards Including Signed Languages in Natural Language Processing

5.1 Building NLP Pipelines

형식상 구어와 수화는 다르지만, 감성,구문, NLP의 화용론(Pragmatics) 측면에서 SLP가 NLP로 확장 가능할 것이고 그래야 한다.

5.2 Collect Real-World-Data

스크린샷 2021-09-13 오후 4.04.55.png

스크린샷 2021-09-13 오후 4.22.14.png

5.3 Practioce Deaf Collaboration

6. Conclusions


우리는 수화를 NLP에 포함시키길 촉구한다. 우리는 특히 성공적인 구어처리 방법과, 수화의 언어학적 특징을 알려주는 CV의 동영상 처리기술을 통해, SLP 기술이 발전될 것이라 믿는다. 수화 단체와 협력관계를 구축하며, 수화 데이터를 모으고 SLP 도구의 기술을 발전시키는데 관심과 노력이 증가하길 소망한다.

느낀점