* (참고) 추후에 내가 보았을 때 어떤 내용의 논문인지 기억할 수 있을 정도로만 간단히 정리하는 리뷰임.매우 러프함 주의 LVLM: 비전 이미지를 input으로 넣었을 때, caption, report를 생성Medvill은 처음으로 메디컬 이미지에 대한 LVLM 모델을 제안 데이터 전처리는 이미지에 대해서 가낭 높은 distribution 값 사이의 이미지를 사용. (0.8~1.2 사이)이는 데이터 불균형 및 오버피팅을 막기 위함. text에 대해서는 긴 description을 가진 text들만 골라서 사용. 더 자세한 설명을 학습에 사용하기 위함. 해당 논문에서 제안하고자 하는 것은 visual (이미지) embedding과 Language (description) embedding을 진행하고 이를 ..