본문 바로가기

딥러닝관련94

SSD(single shot detector) 코드 분석 0. (prior box) SSD에서는 ground truth box, predict box 이외에도 prior box를 미리 정의하여 학습에 사용 1. Feature map size - [38, 19, 10, 5, 3, 1] 2. shrink range(stride) - [8, 16, 32, 64, 100, 300] 3. box size(min, max) - [30, 60, 111, 162, 213, 264] / [60, 111, 162, 213, 264, 315] 4. aspect_ratio - [[2], [2, 3], [2, 3], [2, 3], [2], [2]] 실제 구현상은 어떻게 되어 있나 보자 # https://github.com/qfgaohao/pytorch-ssd """Generate SSD Prior Boxes... 2022. 5. 17.
RNN이란 RNN : Recurrent Neural Network RNN의 기본 구조 Recurrent : 순환한다 Recurrent Neural Network : 순환하는 뉴럴 네트워크 순환을 하기 위해서는 "닫힌 경로" 혹은 "순환하는 경로"가 필요함. 데이터가 순환하면서 끊임없이 정보가 갱신됨 RNN에 이용되는 계층을 "RNN 계층"이라고 부름 RNN의 간단한 구조는 아래와 같음 RNN layer는 순환하는 경로를 포함한다. - 이 순환 경로를 따라 데이터를 layer 안에서 순환시킬 수 있음. 또한 $x_t$를 입력으로 받으며 $t$는 시각을 뜻함 이는 입력으로 $(x_0, x_1, ..., x_t, ...)$ 의 시계열 데이터가, 출력으로 $(h_0, h_1, ..., h_t, ...)$ 가 입력에 대응되.. 2022. 5. 12.
Neural Architecture Search with Reinforcement Learning. part.1 (논문 리뷰) 논문 : https://arxiv.org/pdf/2005.11074.pdf Neural architecture search 분야에 관심이 생겨 관련 분야의 첫 논문을 시작으로 정리를 해보고자 한다. Abstract Neural network는 이미지, 소리, 그리고 자연어를 이해와 같은 많은 어려운 학습 task에서 강력하고 유연한 모델이다. 그러나 neural network를 디자인하기란 여전히 어렵다 (실제로 그렇다, 내 데이터에 적합한 모델을 찾기에는 많은 시간과 노력이 필요하다. ex, 논문 분석 -> 코드 구현 -> 학습 -> 테스트 -> 결과 분석 -> 좋은 결과가 나올 때까지 반복...) 본 논문에서는 RNN을 사용해 neural network model descriptions를 생성하고, .. 2022. 5. 10.
PASCAL VOC detection 데이터 및 라벨 구조(간단히 정리) Detection 코드를 분석하다가 dataset에 대한 기본 구조를 따로 정리 해놓아도 좋을 것 같아서 간단히 해본다. PASCAL VOC 2007 trainval subset : 5011 images test subset : 4952 images PASCAL VOC 2012 train subset : 5717 images validation subset : 5823 images PASCAL VOC 2007 & PASCAL VOC 2012 trainval : 16551 (5011 + 5717 + 5823) 보통 validation 할 때는 pascal voc 2007 test data(4952 images)에 대해서 활용하는 것 같다. PASCAL VOC 2007 이미지 위 그림을 보면 남자와 개가 있.. 2022. 5. 2.