2019년 2월 13일 수요일

#42. 사진 속 글자 읽기, OCR (Optical Character Recognition)


카메라로 차량번호판을 인식하는 것은 이젠 너무나 당연한 기술이 되어 버렸죠?이렇게 사진 속에서 글자를 인식하는 기술을 OCR(optical character recognition)이라고 하는데요, 명함앱, 번역앱 등 정말 다양한 곳에서 쓰이는 기술이랍니다.

혹시 이 문제가 이미 해결 되었다고 생각할지 모르겠지만, 아직도 OCR엔 과제들이 많이 남아있습니다. 그리고 최근엔 이러한 과제들을 딥러닝을 이용해 해결하려 하고있죠. OCR은 text localization과 recognition의 복합 기술인데요, 이를 위해 이미지 인식과 음성 인식의 요소 기술들이 복합적으로 쓰이죠.

오늘은 OCR 리더보드 1등을 기록하셨던 이활석님의 DEVIEW 2018 발표자료를 바탕으로 OCR을 설명해보도록 하겠습니다.


[비디오]


[슬라이드]

* 테리의 딥러닝 토크 
[youtube] https://www.youtube.com/playlist?list=PL0oFI08O71gKEXITQ7OG2SCCXkrtid7Fq 
[facebook] https://www.facebook.com/deeplearningtalk/ 

* T-Robotics의 글은 facebook과 rss reader로도 받아보실 수 있습니다. 
[facebook] http://facebook.com/trobotics 
[rss] http://t-robotics.blogspot.kr/feeds/posts/default