본문 바로가기

합성곱 기초4

29. [CNN기초] 1차원 배열 CNN 훈련하기-3(패딩,선형연산) 이전 28번 구현에서 3개의 배치가 있는 경우 훈련 결과가 상당히 좋지 않았다. 노란색 부분이 1, 그 외에는 0이 되어야 하는데 완벽하지가 않다. 무엇이 문제이고 어떻게 해결할 수 있을까? 여러 가지 방법이 있으며 하나씩 살펴보기로 하자. 1. 패딩 구현하기 첫 번째 이유로 합성곱 시 입력 데이터를 균등하게 사용하지 않을 수 있기 때문이다. 아래 그림을 살펴보자. 합성곱 과정을 살펴보면 양 끝단 자료일 수록 합성곱 횟수가 감소한다. 이에 정확한 특성맵을 작성하기 힘들 수 있다. 이를 해결하기 위해 패딩(Padding)을 사용해 볼 수 있다. 패딩은 입력 데이터 주변에 특정 값으로 채우는 것을 의미한다. 우리는 모든 입력 요소가 균등하게 연산되게 하고 싶으므로 양 끝단을 각각 2개의 0의 요소로 채우는 .. 2023. 1. 5.
28. [CNN기초] 1차원 배열 CNN 훈련하기-2(배치구현) 27번 예제에서 1개의 입력에 대해 1개의 필터로 훈련하였다면 3개의 입력에 대해서 1개의 필터로 훈련한다면 어떨까? 추가로 hyper parameter를 엄밀하게 정의해 보겠다. 1. 변수 정의하기 먼저 입력과 출력을 정의해 보자. 입력 X는 (3, 5) 배열이고 목표 Y는 (3, 3) 배열이다. 입력값을 matplotlib로 이미지화 한다면 아래와 같다. 1에 가까울 수록 밝고, 0에 가까울 수록 어둡다. 가중치 W과 편향 B 설정이다. 정해진 값이 아닌 numpy 랜덤 값을 이용하여 생성해 주자. np.random.seed를 설정하여 매번 실행할 때 마다 같은 결과를 얻을 수 있도록 하자. 2. 합성곱 결과 확인하기(특성맵) 특성맵(feature map)이란, 어떤 이미지를 합성곱 한 결과로써 이미.. 2023. 1. 4.
27. [CNN기초] 1차원 배열 CNN 훈련하기-1 일반적으로 CNN은 이미지, 영상등에서 많이 쓰이지만 이번 예제에서 어떤 원리로 훈련하는지 알기 위해 가장 간단한 1차원 배열로 표현해 보자. 문제 입력 [1., 0.7, 0.5, 0.3, 0.1]인 X = (5, ) 배열을 [1, 1, 1,]로 초기화 된 W = (3, ) 필터로 stride = 1인 합성곱을 하고 [0.5]로 초기화 된 B(1, )의 편향을 추가하면 pred = (3, ) 결과가 출력된다. 이때 목표 [1., 0., 0.] Y = (3, )로 pred를 훈련하고 싶다면 어떻게 하면 될까? 1. 문제를 수학으로 표현하기 먼저 연산 과정을 정의하자. 1) 순전파(Forward) 순전파는 입력 Input → 합성곱 Conv(X, W, B) → 합성곱 출력값을 pred로 아래와 같이 정의한다.. 2023. 1. 3.
26. [CNN기초] CNN 개요 오랜만입니다. 2022년은 많이 바빠서 개인 연구 포스팅을 거의 못했네요. 2021년에는 선형 회귀, 분류, 기초적인 완전연결 인공신경망 Neural Net, 경사하강법, 데이터 전처리를 포스팅 하였고, 2022년에는 CNN을 천천히 하자 다짐했건만... 솔직히, CNN을 라이브러리없이 구현하는 것이 상당히 어려운 작업이었습니다. 올해는 또 둘째까지 돌보았기 때문에 애기들 자는 밤 10시에 같이 자는 경우가 많았죠...(ㅜㅜ) 결국 공부하고 완성하는데 1년이란 시간이 필요했습니다. 각설하고 CNN이 무엇인지, 1차원 CNN, 2차원 CNN(image to column), pooling을 구현하고 마지막으로 라이브러리 없이 도형(세모,네모,원)을 구별해 보는 내용을 연재합니다. 1. 합성곱(CNN)을 사용.. 2023. 1. 1.