본문 바로가기

OpenAI1

[논문 리뷰] Learning Transferable Visual Models From Natural Language Supervision (CLIP) 고정된 형태의 데이터를 이용해 컴퓨터 비전 모델을 학습시키는 것은 모델의 일반화 성능(generality)과 다른 태스크에서의 사용 가능성(usability) 제한이미지와 이 이미지를 설명하는 조금 더 상세한 텍스트(raw text)를 라벨로 사용한다면 기존의 컴퓨터 비전 데이터의 문제를 해결할 수 있을 것fine-grained object classification의 방법으로 추가적인 데이터셋을 활용하지 않고도 특정 태스크를 위해 추가적인 데이터셋으로 학습한 기존 모델들과 견줄만한 성능이 나온다※ Image classification입력 이미지를 사전에 정의한 클래스 중 하나로 분류하는 문제일반적으로 이미지를 입력, 클래스 레이블을 출력하는 지도학습 적용※ Traditional supervised im.. 2024. 7. 13.

이전 1 다음

티스토리툴바