2024-1 하계 모각코 딥다이브 팀
팀 소개
- 저희 딥다이브 팀은 인공지능학과 학술동아리 다이브 임원진들끼리 모여서 만든 팀으로, 인공지능 관련하여 함께 공부하고자 합니다.
😀팀원 소개:
📄활동 계획:
매주 일요일 저녁 6시부터 9시까지 3시간 동안 진행 합니다.
-
1주차: 2024-07-07 18:00 ~ 21:00 |
정보 추출 방법론 공부 |
-
2주차: 2024-07-14 18:00 ~ 21:00 |
데이터셋 증강 관련 방법 공부 |
-
3주차: 2024-07-21 18:00 ~ 21:00 |
다양한 학습 관련 패러다임 공부 |
-
4주차: 2024-07-28 18:00 ~ 21:00 |
모델 설계 1차 |
-
5주차: 2024-08-04 18:00 ~ 21:00 |
모델 설계 2차 |
-
6주차: 2024-08-11 18:00 ~ 21:00 |
모델 설계 3차 |
🎯개인별 목표:
활동 내용
1주차 활동
참석자
오늘의 목표
결과
- 트레인 셋 형태가 2가지 클래스에 대해 특징이 매우 뚜렷하게 나타나는 것을 확인하였으므로,
- 2가지 클래스로 분류하는 모델을 만드는 것은 매우 높은 정확도를 달성할 수 있을 것으로 보임.
- 그러나, 트레인 셋 데이터 구성과 테스트 셋 데이터 구성이 매우 큰 차이를 보이는 만큼,
- 정규화나, 일반화 방법들을 동원하여 모델을 만들어야 할 것으로 보임.

2주차 활동
참석자
오늘의 목표
결과
- 모델 성능 평가 결과, 일반적인 형태의 모델로는 높은 정확도를 달성하기 어려움.
- => 이는 학습에 사용되는 데이터셋이 테스트 셋을 잘 대표하지 못하기 때문인 것으로 보임.
- 데이터셋 증강을 통해 학습 데이터셋을 다양하게 만들어 모델의 일반화 성능을 높일 필요가 있음.
- 랜덤 노이즈 생성 기법을 사용하였으나, 이는 테스트 셋의 노이즈와는 다르므로 성능 향상에 한계가 있음.
- 새로운 학습 방법이 필요할지도 모르겠다는 의견이 나왔음.

3주차 활동
참석자
오늘의 목표
결과
- 대회 참여 결과는 아쉽게도 순위권 안에 들지 못한 상태로 끝났음.
- 결과를 분석해본 결과, 처음부터 접근 방식이 잘못 되었다는 판단을 하게 되었음.
-
토론 결과 파악한 실패 사유
- 2주차에 어느 정도 파악한 내용으로, SW중심대학사업 데이콘 대회는 트레인 데이터셋과 테스트 데이터셋이 매우 다른 형태로 구성되어 있어 일반적인 학습 방법으로는 인공지능 학습 성능을 기대하기 힘들었음.
- 따라서, 사실상 이 대회는 가짜 음성 탐지 대회라기 보다는, 학습 데이터셋의 확률 분포와 테스트 데이터셋의 확률 분포의 차이점에 대해 잘 적응할 수 있는 모델을 설계할 수 있는 능력을 보는 대회인 것으로 판단됨.
- 심지어, 지금까지 인지하지 못했던 부분인데, 대회 홈페이지에 ‘도메인 적응’이라고 적혀있었음.
- 대회 주제도 제대로 인지하지 못하고 3주를 보냈다는 점에서, 이번 대회는 성공하기 힘들었음.
- 실제로 집중해야 했던 부분은, 데이터 증강이 아닌, 모델 설계 형태에서 데이터셋의 확률 분포 차이를 어떻게 극복할 수 있는지에 대한 방법론(예를 들어, 도메인 적응 레이어 혹은 도메인 전환 기법)을 고민해야 했음.
- 이번 대회를 통해, 다음 대회에는 주제를 제대로 파악하고, 대회의 목적을 이해하고, 그에 맞는 방법론을 적용할 수 있도록 노력해야겠다는 생각을 하게 되었음.
- 내용 복습을 위해, 대회가 끝났지만 도메인 적응 기법과, 도메인 전환 기법 관련된 코드를 추가로 작성해보았음.

4주차 활동
참석자
오늘의 목표
- 각자 논문/프로젝트 위한 모델 구조 학습 및 설계 (1차)
결과
- 각자 따로 학습해온 모델 구조와 학습 방식을 공유하였음.
- 공유한 지식을 바탕으로, 본인이 생각하고 있던 모델 구조를 개선하는 등의 설계를 진행

5주차 활동
참석자
오늘의 목표
- 각자 논문/프로젝트 위한 모델 구조 학습 및 설계 (2차)
결과
- 각자 설계한 모델을 바탕으로 모델 학습 코드를 작성하거나 논문 작성을 위한 조사를 진행하였음.
- 자세한 내용은 개인 블로그 참조

6주차 활동
참석자
오늘의 목표
- 각자 논문/프로젝트 위한 모델 구조 학습 및 설계 (3차) 및 최종 회고 진행
결과
- 각자 논문 작성을 위해 진행한 리서치를 바탕으로 가능한 인원들은 논문을 작성해왔음.
- 또한, 각자 작성한 논문에 관련하여 간단하게 이야기를 나누었음.
- 짧은 여름 방학 모각코 기간 동안 모든 팀원이 모각코 기간 동안 논문을 작성해 내기는 힘들었지만,
- 대회와 논문 리서치 등을 거치며 여름 방학이 시작하기 전에 비해 분명한 성장을 이룬 것 같아 다들 뿌듯함을 느꼈음.
- The end…

팀 회고
📄활동 성과:
- SW 중심대학 사업단 주관 가짜 음성 탐지 대회 참여 및 결과 분석
- 특징 추출 방법론, 데이터셋 증강 방법론, 학습 패러다임 등 다양한 학습 방법론에 대한 토론
- 논문 작성을 위한 주제 선정 및 리서치 (일부 인원에 한하여 논문 작성 및 학회 제출)
🎯개인별 회고: