비전인식AI - GoogleNet : 개, 고양이 그리고 버섯!
스터디 12주차 발표내용 공유드립니다. - 갑툭튀 12주차? 시리즈물은 아니며, 개인발표 내용 중 공유할 만한 부분에 대해서 일부 발췌 했습니다. 치명적인 게으름을 타파하려면 계속 계속 끊지말고 스터디를 이어가야 하는데, 아쉽게도 본 스터디도 작년(2020년) 종결 된 스터디 입니다. (각자 일상생활도 있고, 추구하는 목표도 다르고, 자율적 스터디의 텐션을 계속 유지한 다는게 이렇게 어렵습니다. ㅜㅠㅠ)
인간의 게으름은 끝이없고,
같은 게으름을 반복하게 된다.
googLeNet 은 알고리즘 대표 컨셉트인 inception 모듈을 사용하여 더 Deep 하게 Network 층을 쌓아서, 전년도 우승자 VGG19(19-Layer)를 누르고 2014년 ILSVRC (ImageNet Large Scale Visual Recognition Challenge) 에서 우승한 이미지 인식에 있어서 이정표적인 모델입니다.
googLeNet 에서 뒷쪽 이니셜을 굳이, LeNet을 사용 한 것은 릭쿤교수의 LeNet-5 와 어떤 연관성을 보여주는지 모르겠네요. 이미지인식의 개척자, 르넷에 대한 오마쥬일까요? 아무튼 구글넷은 새로운 컨셉트인 Inception 모델을 도입하여 층을 더 깊게 쌓으면서, 과적합 문제에 추론의 정확성을 높이고 과적합 문제를 해결 하였습니다. 구글링을 해보면 한글로 설명된 블로그들이 많이 있으므로 참고해 주시고, 영어로 잘 설명된 사이트 하나를 추천 드리겠습니다.
towardsdatascience.com/deep-learning-googlenet-explained-de8861c82765
Deep Learning: GoogLeNet Explained
One of the initial convolutional neural network that dared to go deeper
towardsdatascience.com
[CNN 알고리즘들] GoogLeNet(inception v1)의 구조
LeNet-5 => https://bskyvision.com/418 AlexNet => https://bskyvision.com/421 VGG-F, VGG-M, VGG-S => https://bskyvision.com/420 VGG-16, VGG-19 => https://bskyvision.com/504 GoogLeNet(inception v1) =>..
bskyvision.com
오늘 포스팅 하고자 하는 주제는 구글넷으로 학습된 데이터를 가지고, 몇가지 인덱스에 대해서 테스트를 해본 내용입니다. 보통 이미지 인식 하면, 개 or 고양이 를 판단하는것을 많이 언급하곤 합니다. 갑자기 버섯이 하나 더 붙은 것은 같이 스터디를 하시는 분이 버섯분류 문제를 진행하고 계서서 내친 김에 주제(인덱스)를 하나 더 붙여 봤습니다. 학습데이터는 Tensorflow Hub 에서 학습데이터를 가져와서 사용했으며, 코드는 아래첨부하는 것으로 하고, 결과만 빠르게 살펴볼 예정입니다.
구글이미지 검색에서 12개의 고양이 사진을 가져와서 추론을 해보았습니다. 결과는 Probablity 를 간단히 판다스를 이용해서 시각화 하였습니다. 확률은 높은데, 오답에 대해 높은 확률로 확신하는 모습을 보여줍니다. 기본적인 고양이 품종도 못 맞추며, 심지어 고양이인데도 치와와(Chihuahua) ... 55.8% 라고 우기는 모습도 보이네요.
확신(Probablity)가 평균적으로 상당히 올라간 모습을 보여주고 있습니다. 박스챠트가 오른쪽으로 치우쳐 있습니다. 게다가 좀 놀라울 정도로 개의 종류를 잘 맞춥니다.
버섯 분류는, 더욱 자신이 없는 모습을 보여줍니다.
결론적으로 말해서 ILSVR에는 이미지 1,000 개의 Index 가 있는데, 기본적으로 버섯에 대한 Index 와 고양이 Index 가 종류가 몇개 되지 않는데 반해, 개에 대한 Index는 엄청 풍부합니다. 그리고 개에 대한 인식률이 버섯이나 고양이에 대한 인식률 보다 월등히 높습니다. 이건, 문화적인 차이일까요?
심지어 푸들과 스탠다드푸들을 구분해냅니다. 그냥 둘 다 얼굴이 북실북실 곱슬털에 귀여운 얼굴인데 말이죠.. 원인은 모르겠지만, 구글넷의 개 인식률은 놀라울 정도로 정확합니다.