머신 러닝 5

Bias recipe for machine learning

"바이어스 레시피(Bias Recipe)"는 기계 학습에서 모델의 바이어스를 다루는 방법에 관한 지침이나 접근 방식을 의미합니다. 이는 모델이 훈련 데이터에 과도하게 적합되어 새로운 데이터에 대한 일반화 능력이 부족할 때 발생하는 높은 바이어스를 줄이는 데 중점을 둡니다. 여기에는 다양한 전략과 기법이 포함될 수 있습니다: 모델 복잡도 증가: 너무 간단한 모델은 데이터의 중요한 특성을 놓칠 수 있습니다. 따라서 모델의 복잡도를 적절히 증가시켜 데이터의 다양한 패턴과 관계를 더 잘 학습할 수 있도록 합니다. 예를 들어, 더 많은 층이나 뉴런을 가진 신경망을 사용하거나, 결정 트리에서 더 많은 분할을 허용하는 것 등이 있습니다. 특징 엔지니어링 (Feature Engineering): 데이터의 추가적인 정보..

Bias and Variance - Tradeoff

머신러닝과 통계 모델링에서, 바이어스(Bias)와 분산(Variance)을 이해하는 것은 모델 성능 문제를 진단하고 적절한 모델링 접근법 및 훈련 전략을 선택하는 데 필수적입니다. 바이어스 (Bias) 정의: 바이어스는 학습 알고리즘에서 과도하게 단순화된 가정에서 발생하는 오류입니다. 높은 바이어스는 알고리즘이 특성과 타겟 출력 사이의 중요한 관계를 놓치게 하여, 모델이 과소적합(underfitting)되는 결과를 초래할 수 있습니다. 특징: 높은 바이어스를 가진 모델은 일반적으로 데이터 구조에 대해 강한 가정을 합니다. 바이어스가 높은 경우, 모델은 훈련 데이터의 복잡성을 충분히 학습하지 못할 수 있습니다. 과소적합(underfitting)이 나타나는 경우, 훈련 데이터와 테스트 데이터 모두에서 낮은 ..

[DL] 1,2 Stage Detector

✍ One Stage Detector, Two Stage Detector 란?? 👉 방식의 차이점 1. One(Single) Stage Detector 2 Stage Detector와 반대로 Region Proposal(영역 제안)과 Detection(Classification)이 동시에 동작 비교적 성능이 빠르지만, 정확도가 낮다 2. Two Stage Detector Region Proposal과Detection이 순차적으로 진행하며 동작 비교적 성능은 느리지만, 정확도는 높다 🙋‍♂️ 용어 정리 Region Proposal은 이미지 영역 내, 후보군을 추출하여 "물체가 있을 만한" 영역을 빠르게 탐색 하는 방식 Sliding Window는 Region Proposal 이전에 사용 했던 방식으로 이미..

[ML] 지도, 비지도, 강화 학습

✍ 지도 - 비지도 - 강화 학습이란?? 👉 머신 러닝 학습하려는 문제의 유형에 따라, 아래와 같이 크게 3가지로 분류된다. 1. Supervised Learning 정답이 있는 데이터를 활용해 데이터를 학습 시키는 방식 대표적으로는 분류, 회귀 방식이 존재함 2. Unsupervised Learning 정답이 없는 데이터를 활용해 데이터를 학습 시키는 방식 대표적으로는 클러스터링 방식이 존재함 3. Reinforcement Learning (RL) 데이터가 존재하는 것도 아니며, 정답이 따로 정해져 있지 않은 방식 강화 학습은 에이전트, 환경, 상태, 행동, 보상의 개념을 사용하여 이해 https://wendys.tistory.com/category/%E2%8C%A8%20DEVELOPMENT/AI '⌨..

[DL] CIFAR-10

🙋‍♂️ CIFAR-10 구성 CIFAR-10 Data Set은 32 x 32 크기의 60,000개의 Image Set으로 구성 되어 있으며, 10개의 Class로 분류 된다.각 Class는 60,000개의 전체 이미지와 50,000개의 Train Image, 10,000개의 Test Image로 구성 (Labels는 동일) → Mnist보다 가볍고, 시간이 덜 소요됨 ✍ Data Set Load / Labels 확인 # Default import import numpy as np # linear algebra import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv) import os from tensorflow.keras.datase..

MLDL_정리/Sample 2022.03.22