Vision 9

[DL] 1,2 Stage Detector

✍ One Stage Detector, Two Stage Detector 란?? 👉 방식의 차이점 1. One(Single) Stage Detector 2 Stage Detector와 반대로 Region Proposal(영역 제안)과 Detection(Classification)이 동시에 동작 비교적 성능이 빠르지만, 정확도가 낮다 2. Two Stage Detector Region Proposal과Detection이 순차적으로 진행하며 동작 비교적 성능은 느리지만, 정확도는 높다 🙋‍♂️ 용어 정리 Region Proposal은 이미지 영역 내, 후보군을 추출하여 "물체가 있을 만한" 영역을 빠르게 탐색 하는 방식 Sliding Window는 Region Proposal 이전에 사용 했던 방식으로 이미..

[ML] 지도, 비지도, 강화 학습

✍ 지도 - 비지도 - 강화 학습이란?? 👉 머신 러닝 학습하려는 문제의 유형에 따라, 아래와 같이 크게 3가지로 분류된다. 1. Supervised Learning 정답이 있는 데이터를 활용해 데이터를 학습 시키는 방식 대표적으로는 분류, 회귀 방식이 존재함 2. Unsupervised Learning 정답이 없는 데이터를 활용해 데이터를 학습 시키는 방식 대표적으로는 클러스터링 방식이 존재함 3. Reinforcement Learning (RL) 데이터가 존재하는 것도 아니며, 정답이 따로 정해져 있지 않은 방식 강화 학습은 에이전트, 환경, 상태, 행동, 보상의 개념을 사용하여 이해 https://wendys.tistory.com/category/%E2%8C%A8%20DEVELOPMENT/AI '⌨..

[Machine Vision] OCR, OCV 차이

🙋‍♂️ OCR, OCV란?? ✍ OCR란?? OCR (Optical Character Recognition) / 광학 문자 인식 사람 또는 기계를 통해 인쇄된 문자의 형상을 이미지 스캐너로 스캔하여 기계가 읽을 수 있도록 문자로 변환 하는 기술 ✍ OCV란?? OCV (Optical Character Verification) / 광학 문자 검증 문자열의 존재와 문자의 가독성을 확인 및 검증하여 인쇄 품질을 평가하는 기술 💁‍♂️ Vision 검사 / OCR -. 차량 번호판 검사 -. 포장 공정 (QR CODE, 라벨 정보 검사, Tray 정보 추출,,,) ✍ OCR Tool / Cognex 1) Train Image 내, 학습 할 문자 추출 2) Train Image 기준 / 영문 + 숫자 추출 → ..

[DL] CIFAR-10

🙋‍♂️ CIFAR-10 구성 CIFAR-10 Data Set은 32 x 32 크기의 60,000개의 Image Set으로 구성 되어 있으며, 10개의 Class로 분류 된다.각 Class는 60,000개의 전체 이미지와 50,000개의 Train Image, 10,000개의 Test Image로 구성 (Labels는 동일) → Mnist보다 가볍고, 시간이 덜 소요됨 ✍ Data Set Load / Labels 확인 # Default import import numpy as np # linear algebra import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv) import os from tensorflow.keras.datase..

MLDL_정리/Sample 2022.03.22

[DL] - Deep Learning CNN / Filter

🙋‍♂️ 일반적인 Vision 영역에서의 Filter와 Deep Learning CNN에서의 Filter 값의 차이?? ▶ Filter는 CNN에서 일반적으로 Kernel과 거의 혼영 되어 사용하며, 명확히 구분을 하자면 Filter는 다수의 Kernel들로 구성된 Layer이다. 그리고 Kernel은 Filter 내, 서로 다른 값을 가질 수 있다는 특징이 있다. ✍ Kernel 크기가 클 수록 입력 Feature Map에서 더 큰 Feature 정보를 가져 올 수 있으나, 사이즈 만큼 Convolution 연산을 할 경우, 훨씬 더 많은 연산량과 Parameter가 필요함 → 보통 3 X 3 Kernel Size 사용 ✍일반적으로 Vision 영역에서 Filter는 User가 목적에 맞는 특정 Fil..

[DL] - Mediapipe

🙋‍♂️ Mediapipe란?? Mediapipe는 Google에서 주로 인체 즉, 사람을 대상으로하는 비전 인식 기능들을 AI 모델 갭라과 기계 학습까지 마친 상태로 제공하는 서비 및 프레임 워크다. ✍ 비전 AI 솔루션 ① Face Object Detection ② Face Mesh ③ Hands ④ Pose ⑤ Box Tracking → 다양한 인체, 사물 등에 대한 AI 비전 인식 솔루션을 제공 ✍ 다양한 개발 환경 및 언어 지원 ✍ Mediapipe Homepage → https://google.github.io/mediapipe/ Home Cross-platform, customizable ML solutions for live and streaming media. google.github.io

[DL] - Ground truth

🙋‍♂️ 정의 딥러닝에서 흔히 사용 되는 Label이라는 용어는 Target 또는 정답이라는 의미로 답이 명확하게 지정되어 있는 값을 뜻한다. R-CNN을 공부하면서 Ground truth 라는 용어를 알게 되었는데, 처음엔 Label과 Ground truth라는 용어가 동일한 뜻을 가진 줄 알았는데, 언뜻 보면 비슷하지만 결코 같은 의미가 아니다. 🙋‍♂️ 차이점 ☝ Label은 흔히 정답지라고 불리며 명확하게 답이 정해져 있는 값을 뜻한다. ✌ Ground thuth는 "User가 생각하는 정답" or "Object 내의 우리가 원하는 Detection 출력 값"을 의미하고 있다. 참고 블로그 : https://mac-user-guide.tistory.com/14?category=775535