Google Gemini는 구글이 개발한 강력한 AI 모델로, 대화 및 텍스트 생성 기능을 지원합니다. 현재 ComfyUI는 Google Gemini API를 통합하여, ComfyUI에서 관련 노드를 직접 사용해 대화 기능을 완성할 수 있도록 지원합니다.
이 가이드에서는 해당 대화 기능을 완성하는 과정을 안내해 드립니다.
파트너 노드를 사용하려면 올바르게 로그인되어 있고 허가된 네트워크 환경을 사용하고 있는지 확인해야 합니다. 파트너 노드를 사용하기 위한 구체적인 요구사항은 문서의 파트너 노드 개요 섹션을 참조해 주세요.
휴대용 또는 자체 배포 사용자
데스크톱 또는 클라우드 사용자
ComfyUI가 최신 버전으로 업데이트되었는지 확인하세요.이 가이드의 워크플로우는 워크플로우 템플릿에서 확인할 수 있습니다.
템플릿에서 찾을 수 없다면, 귀하의 ComfyUI가 오래된 버전일 수 있습니다. (데스크톱 버전의 업데이트는 다소 지연될 수 있습니다)워크플로우를 로드할 때 노드가 누락되는 경우, 가능한 원인:
- 최신 ComfyUI 버전(야간 빌드)을 사용하고 있지 않음
- 일부 노드가 시작 시 가져오기에 실패함
- 데스크톱 버전은 ComfyUI 안정판 기반으로, 새로운 데스크톱 안정판이 출시되면 자동으로 업데이트됩니다.
- 클라우드는 ComfyUI 안정판 출시 후 업데이트됩니다.
따라서 이 문서에서 핵심 노드가 누락된 것을 발견했다면, 그 이유는 새로운 핵심 노드가 아직 최신 안정판에 공개되지 않았기 때문일 수 있습니다. 다음 안정판 출시를 기다려 주세요.
Google Gemini 챗 워크플로우
1. 워크플로우 파일 다운로드
아래 Json 파일을 다운로드한 후, ComfyUI로 드래그하여 해당 워크플로우를 로드해 주세요.
Json 형식 워크플로우 파일 다운로드
2. 워크플로우를 단계별로 완료하세요
해당 템플릿에서는 역할 프롬프트를 분석하고 생성하는 프롬프트를 구축했으며, 이를 통해 이미지를 해당 드로잉 프롬프트로 해석합니다.
이미지에 표시된 번호를 참고해 기본적인 텍스트-to-image 워크플로우를 완료할 수 있습니다:
이미지 로드 노드에서 AI가 해석하도록 할 이미지를 로드하세요.
- (선택사항) 필요하다면
Google Gemini에서 프롬프트를 수정해 특정 작업을 수행하도록 AI에게 지시할 수 있습니다.
실행 버튼을 클릭하거나, 단축키 Ctrl(cmd) + Enter를 사용해 대화를 실행하세요.
- API가 결과를 반환할 때까지 기다린 후,
미리보기 모든 항목 노드에서 AI가 반환한 내용을 확인할 수 있습니다.
3. 추가 참고사항
- 현재 파일 입력 노드인
Gemini 입력 파일은 먼저 파일을 ComfyUI/input/ 디렉토리에 업로드해야 합니다. 이 노드는 개선 중이며, 업데이트 이후 템플릿을 수정할 예정입니다.
- 워크플로우에는
배치 이미지를 사용한 예시가 제공됩니다. 여러 이미지를 AI가 해석해야 한다면, 단계 도표를 참고해 마우스 오른쪽 클릭으로 해당 노드 모드를 항상으로 설정해 활성화할 수 있습니다.