천천히 성장하는 부공딩코

천천히 성장하는 부공딩코

  • 분류 전체보기 (19)
    • OS(운영체제) (0)
    • python (0)
    • 백준 알고리즘 (6)
      • brute force (1)
      • Dynamic Programming (1)
      • dfs & bfs (3)
      • greedy (1)
    • 논문리뷰 (8)
    • 명령어 & Tip (3)
  • 홈
  • 태그
  • 방명록
RSS 피드
로그인
로그아웃 글쓰기 관리

천천히 성장하는 부공딩코

컨텐츠 검색

태그

DeepLearning 논문리뷰 stable video diffusion 연구노트 single object tracking ai논문 neighbortrack 딥러닝논문 LLM 이미지바인드 리뷰 컴퓨터비전논문 컴퓨터비전 CogVLM diffusers 논문 diffusion model LLM논문리뷰 Computer Vision AI flashattention

최근글

댓글

공지사항

아카이브

CogVLM(1)

  • [논문리뷰] CogVLM: Visual Expert for Pretrained Language Models

    이번에는 칭화대(Tsinghua University)에서 공개한 CogVLM에 대해 리뷰를 시작하겠습니다.마찬가지로 사진으로 올린 피피티는 제가 직접 작성한 피피입니다. CogVLM은 오픈 소스 Visual Language 모델로, 기존의 shallow alignment 방식에는 한계가 있었습니다. 이 방식에서는 이미지 특징을 텍스트 모델의 입력 공간으로 매핑하는데, 시각적 특징과 언어 모델 간의 직접적인 대응 관계가 부족하여 성능에 한계를 보였습니다.CogVLM은 이를 해결하기 위해 학습 가능한 visual expert 모듈을 도입하였습니다. 이 모듈을 통해 이미지 인코더와 고정된 사전 훈련된 언어 모델 간의 격차를 줄여, 성능 저하 없이 비전-텍스트 특징의 깊은 융합(Deep Fusion)을 가능하게..

    2026.01.07
이전
1
다음
티스토리
© 2018 TISTORY. All rights reserved.

티스토리툴바