2024-1 하계 모각코 딥다이브 팀 기록

GITHUB로 편집하기

V.IRACKIRACK000

2024-1 하계 모각코 딥다이브 팀



팀 소개

  • 저희 딥다이브 팀은 인공지능학과 학술동아리 다이브 임원진들끼리 모여서 만든 팀으로, 인공지능 관련하여 함께 공부하고자 합니다.

😀팀원 소개:

📄활동 계획:

매주 일요일 저녁 6시부터 9시까지 3시간 동안 진행 합니다.

  • 1주차: 2024-07-07 18:00 ~ 21:00 정보 추출 방법론 공부
  • 2주차: 2024-07-14 18:00 ~ 21:00 데이터셋 증강 관련 방법 공부
  • 3주차: 2024-07-21 18:00 ~ 21:00 다양한 학습 관련 패러다임 공부
  • 4주차: 2024-07-28 18:00 ~ 21:00 모델 설계 1차
  • 5주차: 2024-08-04 18:00 ~ 21:00 모델 설계 2차
  • 6주차: 2024-08-11 18:00 ~ 21:00 모델 설계 3차

🎯개인별 목표:



활동 내용

1주차 활동

참석자

오늘의 목표

  • 정보 추출 방법론에 관한 토론

결과

  • 트레인 셋 형태가 2가지 클래스에 대해 특징이 매우 뚜렷하게 나타나는 것을 확인하였으므로,
  • 2가지 클래스로 분류하는 모델을 만드는 것은 매우 높은 정확도를 달성할 수 있을 것으로 보임.
  • 그러나, 트레인 셋 데이터 구성과 테스트 셋 데이터 구성이 매우 큰 차이를 보이는 만큼,
  • 정규화나, 일반화 방법들을 동원하여 모델을 만들어야 할 것으로 보임.

활동 사진


2주차 활동

참석자

오늘의 목표

  • 데이터셋 증강과 관련된 토론

결과

  • 모델 성능 평가 결과, 일반적인 형태의 모델로는 높은 정확도를 달성하기 어려움.
  • => 이는 학습에 사용되는 데이터셋이 테스트 셋을 잘 대표하지 못하기 때문인 것으로 보임.
  • 데이터셋 증강을 통해 학습 데이터셋을 다양하게 만들어 모델의 일반화 성능을 높일 필요가 있음.
  • 랜덤 노이즈 생성 기법을 사용하였으나, 이는 테스트 셋의 노이즈와는 다르므로 성능 향상에 한계가 있음.
  • 새로운 학습 방법이 필요할지도 모르겠다는 의견이 나왔음.

활동 사진


3주차 활동

참석자

오늘의 목표

  • 가짜 음성 탐지 대회 결과에 대한 토론

결과

  • 대회 참여 결과는 아쉽게도 순위권 안에 들지 못한 상태로 끝났음.
  • 결과를 분석해본 결과, 처음부터 접근 방식이 잘못 되었다는 판단을 하게 되었음.
  • 토론 결과 파악한 실패 사유

    • 2주차에 어느 정도 파악한 내용으로, SW중심대학사업 데이콘 대회는 트레인 데이터셋과 테스트 데이터셋이 매우 다른 형태로 구성되어 있어 일반적인 학습 방법으로는 인공지능 학습 성능을 기대하기 힘들었음.
    • 따라서, 사실상 이 대회는 가짜 음성 탐지 대회라기 보다는, 학습 데이터셋의 확률 분포와 테스트 데이터셋의 확률 분포의 차이점에 대해 잘 적응할 수 있는 모델을 설계할 수 있는 능력을 보는 대회인 것으로 판단됨.
    • 심지어, 지금까지 인지하지 못했던 부분인데, 대회 홈페이지에 ‘도메인 적응’이라고 적혀있었음.
    • 대회 주제도 제대로 인지하지 못하고 3주를 보냈다는 점에서, 이번 대회는 성공하기 힘들었음.
    • 실제로 집중해야 했던 부분은, 데이터 증강이 아닌, 모델 설계 형태에서 데이터셋의 확률 분포 차이를 어떻게 극복할 수 있는지에 대한 방법론(예를 들어, 도메인 적응 레이어 혹은 도메인 전환 기법)을 고민해야 했음.
    • 이번 대회를 통해, 다음 대회에는 주제를 제대로 파악하고, 대회의 목적을 이해하고, 그에 맞는 방법론을 적용할 수 있도록 노력해야겠다는 생각을 하게 되었음.
  • 내용 복습을 위해, 대회가 끝났지만 도메인 적응 기법과, 도메인 전환 기법 관련된 코드를 추가로 작성해보았음.

활동 사진


4주차 활동

참석자

오늘의 목표

  • 각자 논문/프로젝트 위한 모델 구조 학습 및 설계 (1차)

결과

  • 각자 따로 학습해온 모델 구조와 학습 방식을 공유하였음.
  • 공유한 지식을 바탕으로, 본인이 생각하고 있던 모델 구조를 개선하는 등의 설계를 진행

활동 사진


5주차 활동

참석자

오늘의 목표

  • 각자 논문/프로젝트 위한 모델 구조 학습 및 설계 (2차)

결과

  • 각자 설계한 모델을 바탕으로 모델 학습 코드를 작성하거나 논문 작성을 위한 조사를 진행하였음.
  • 자세한 내용은 개인 블로그 참조

활동 사진


6주차 활동

참석자

오늘의 목표

  • 각자 논문/프로젝트 위한 모델 구조 학습 및 설계 (3차) 및 최종 회고 진행

결과

  • 각자 논문 작성을 위해 진행한 리서치를 바탕으로 가능한 인원들은 논문을 작성해왔음.
  • 또한, 각자 작성한 논문에 관련하여 간단하게 이야기를 나누었음.
  • 짧은 여름 방학 모각코 기간 동안 모든 팀원이 모각코 기간 동안 논문을 작성해 내기는 힘들었지만,
  • 대회와 논문 리서치 등을 거치며 여름 방학이 시작하기 전에 비해 분명한 성장을 이룬 것 같아 다들 뿌듯함을 느꼈음.
  • The end…

활동 사진



팀 회고

📄활동 성과:

  • SW 중심대학 사업단 주관 가짜 음성 탐지 대회 참여 및 결과 분석
  • 특징 추출 방법론, 데이터셋 증강 방법론, 학습 패러다임 등 다양한 학습 방법론에 대한 토론
  • 논문 작성을 위한 주제 선정 및 리서치 (일부 인원에 한하여 논문 작성 및 학회 제출)

🎯개인별 회고: