컴린이 일기장/Today I Learned
2021. 10. 8.
[TIL] Pytorch Dataloader - (batch) sampler, collate_fn
[주절주절] 오랜만에 쓰는 글... 개강도 하고 부스트캠프 업무도 피크였다보니 그동안 글을 많이 못썼다. 오늘 부스트캠프 슬랙에 한 캠퍼님이 collate_fn의 역할이 무엇인지, 꼭 필요한지 모르겠다는 식의 질문을 남겨주셨는데, 나도 우리 베이스라인 코드를 작성하면서 비슷한 생각을 했었다. 그래서 오늘 조금 여유로운 김에 다른 마스터, 멘토님들이 달아주신 좋은 코멘트, 레퍼런스 참고해서 정리해보고자 한다. [Today I Learned] # Overview # sampler - Dataset은 idx로 데이터를 가져오도록 설계 되었다. 이 때 Sampler는 이 idx 값을 컨트롤하는 방법이다. - 따라서 sampler를 사용할 때는 shuffle 파라미터는 False가 되어야한다. - __len__과..