
안녕하세요! 오늘도 터미널 앞에서 고군분투 중인 여러분, 혹시 Gemini CLI를 그냥 '말 잘 듣는 챗봇' 정도로만 쓰고 계신 건 아니죠? 저도 처음엔 그랬거든요. 하지만 이 녀석의 진짜 무서운 점은 바로 '내 컴퓨터에 있는 모든 도구를 자기 것처럼 쓴다'는 것과 '눈이 달려 있다'는 거예요. 오늘은 그 놀라운 비법인 팁 17번과 18번을 파헤쳐 보겠습니다!
📌 에디터의 3줄 요약- Tip 17: 여러분의 $PATH에 있는 모든 CLI 도구가 Gemini의 팔다리가 됩니다.
- Tip 18: 이미지, PDF, 오디오까지! '멀티모달' 기능을 통해 터미널에 눈을 달아주세요.
- 단순한 답변을 넘어 실제 작업을 수행하는 진정한 'AI 에이전트'로 진화합니다.
Tip 17: 모든 CLI 도구를 Gemini의 무기로 활용하기
여러분, Gemini CLI는 단순히 텍스트를 뱉는 게 아니에요. 사실 이 녀석은 여러분의 쉘(Shell)에 접근할 권한이 있거든요. 즉, cURL, ImageMagick, git, Docker 등 여러분이 설치한 모든 도구가 이제 Gemini의 스위스 아미 나이프가 되는 셈이죠!
어떻게 이런 일이 가능한가요?
만약 여러분이 "이 폴더에 있는 모든 PNG 파일을 WebP로 바꿔줘"라고 말하면, Gemini는 똑똑하게도 시스템에 convert 유틸리티가 있는지 확인합니다. 그리고는 알아서 쉘 루프 문을 짜서 실행해 버리죠. 와, 소름 돋지 않나요? 제가 직접 써본 몇 가지 사례를 표로 정리해 드릴게요.
| 사용 도구 | 활용 시나리오 |
|---|
| FFmpeg | 비디오 파일에서 오디오만 쏙 뽑아내기 |
| Docker CLI | 앱 빌드부터 컨테이너 실행까지 한 번에 요청 |
| Python | 현재 디렉토리에 즉석 HTTP 서버 띄우기 |
| AWS/GCloud CLI | 클라우드 리소스 상태 확인 및 관리 |
물론 보안이 걱정되실 거예요. 기본적으로 Gemini는 명령을 실행하기 전에 꼭! 여러분에게 "이거 실행해도 될까요?"라고 물어봅니다. (물론 자신감 넘치는 분들은 YOLO 모드를 쓰시겠지만요...) 여러분의 $PATH가 곧 AI의 지능이 되는 이 신기한 경험, 꼭 해보셔야 합니다.
Tip 18: 멀티모달 AI 활용하기 - 이미지를 읽는 터미널
"에이, 터미널은 검은 화면에 글자만 나오는 거 아냐?"라고 생각하셨다면 오산입니다! Gemini CLI는 멀티모달 모델을 기반으로 하기 때문에 @파일명 문법을 통해 이미지나 문서를 이해할 수 있어요.
눈이 달린 Gemini로 할 수 있는 멋진 일들
- 에러 스크린샷 분석: "이 에러 화면 좀 봐줘 @error.png - 뭐가 문제일까?"라고 물어보세요. 눈으로 보고 해결책을 제시해 줍니다.
- 디자인을 코드로: 웹사이트 기획안 스크린샷을 던져주고 "이걸 React 컴포넌트로 짜줘"라고 하면 구조를 잡아줍니다. 완전 사기급 기능이죠?
- 데이터 추출 (OCR): 영수증이나 인보이스 사진을 넣고 "테이블 형식으로 정리해줘"라고 하면 텍스트를 추출해서 깔끔하게 정리해 줍니다.
- 자동 분류: 수백 장의 사진을 "풍경, 인물, 음식 폴더로 나눠서 이동시켜"라고 시킬 수도 있습니다.
비록 터미널 화면에 그림이 직접 그려지지는 않지만(ASCII 아트로는 가능할지도?), Gemini는 이미지를 완벽하게 이해하고 결과를 텍스트나 파일로 돌려줍니다. PDF나 오디오 파일도 마찬가지예요. 인공지능 비서에게 눈과 귀를 달아준 셈이죠!
❓ Gemini가 제 컴퓨터의 파일을 지워버리면 어떡하죠?
💡 걱정 마세요! Gemini CLI는 위험할 수 있는 쉘 명령을 실행하기 전에 반드시 사용자에게 확인을 요청합니다. 또한, 더 안전하게 사용하려면 Gemini 전용 $PATH를 설정해서 접근 가능한 도구를 제한할 수도 있답니다.
❓ 아주 큰 이미지나 고화질 PDF도 처리가 가능한가요?
💡 네, 웬만한 크기는 다 소화합니다! 다만 파일이 너무 크면 토큰 소모량이 많아지거나 전송 시간이 길어질 수 있으니, 핵심 내용이 잘 보이는 적당한 크기의 파일을 권장해요.
❓ 오디오 파일 트랜스크립트(자막)도 만들 수 있나요?
💡 물론이죠! `@interview.mp3`처럼 파일을 참조시키고 텍스트로 변환해달라고 요청하면 내부적으로 멀티모달 엔진이 소리를 듣고 글로 옮겨줍니다. 회의록 정리할 때 개꿀!
글을 마치며: 당신의 터미널은 이제 무한합니다
오늘 살펴본 두 가지 팁의 핵심은 '확장성'입니다. Gemini는 스스로 할 수 없는 일도 여러분의 컴퓨터에 깔린 도구를 빌려 수행하고, 텍스트를 넘어 시각적 정보까지 받아들이죠. 이제 터미널은 단순한 코딩 창이 아니라, 여러분의 명령을 수행하는 강력한 지휘 본부가 된 거예요! 자, 지금 바로 터미널을 켜고 `@`를 입력해 보세요. 새로운 세계가 열릴 겁니다. 그럼 저는 더 재밌는 팁으로 다시 찾아올게요. 안녕!
[이 포스팅은 정보 제공을 목적으로 하며, Gemini CLI를 통한 쉘 명령 실행 시 발생할 수 있는 데이터 변경이나 손실에 대한 책임은 사용자에게 있습니다. 중요 명령 실행 전 반드시 검토하시기 바랍니다.]