I Just Built An AI Agent Clone Of Myself (n8n)
1. AI 에이전트 복제본 생성 개요
이 비디오에서는 NAND와 Eleven Labs를 결합하여 자신만의 AI 에이전트 복제본을 만드는 방법을 설명합니다. NAND는 자동화와 AI 에이전트 기능을 제공하고, Eleven Labs는 음성 복제 기능을 제공합니다. 이 튜토리얼에서는 텔레그램을 트리거로 사용하여 메시지를 수신하면 AI 에이전트가 작동하도록 설정합니다. 하지만 WhatsApp, Twilio, Siri 등 다양한 트리거를 사용할 수 있습니다. 핵심은 NAND의 텔레그램 통합을 설정하고 Botfather를 통해 텔레그램 봇을 생성하여 액세스 토큰을 얻는 것입니다. 액세스 토큰은 NAND 워크플로우 내에서 텔레그램과의 연결을 설정하는 데 사용됩니다.
2. 텔레그램 트리거 설정 및 스위치 문 사용
워크플로우를 시작하려면 텔레그램에서 메시지를 수신하는 트리거를 생성해야 합니다. 텔레그램 트리거를 설정하려면 Botfather와 대화를 시작하고 봇을 생성하여 액세스 토큰을 받아야 합니다. 그런 다음 액세스 토큰을 사용하여 NAND에서 텔레그램과의 연결을 설정합니다. 연결이 설정되면 스위치 문을 사용하여 오디오 메시지와 텍스트 메시지를 구분합니다. 오디오 메시지는 텍스트 필드가 비어 있는 반면, 텍스트 메시지는 텍스트 필드에 내용이 포함됩니다. 스위치 문을 통해 메시지 유형에 따라 워크플로우의 다른 경로로 메시지를 보낼 수 있습니다.
3. 오디오 메시지 처리 및 텍스트 변환
오디오 메시지를 처리하려면 먼저 텔레그램에서 파일 ID를 사용하여 오디오 파일을 다운로드해야 합니다. 그런 다음 OpenAI를 사용하여 음성을 텍스트로 변환합니다. OpenAI 통합을 사용하려면 API 키가 필요하며, 이는 OpenAI 플랫폼에서 얻을 수 있습니다. OpenAI API를 사용하려면 계정에 최소 5달러를 충전해야 합니다. 텍스트 메시지의 경우, 메시지 텍스트를 새로운 필드에 저장합니다.
4. 메시지 병합 및 AI 에이전트 통합
오디오 메시지와 텍스트 메시지를 처리한 후에는 병합 단계를 사용하여 두 메시지를 다시 결합합니다. 병합 단계는 텍스트 키를 기반으로 작동하며, 오디오 메시지에서 변환된 텍스트와 원래 텍스트 메시지를 모두 동일한 키 아래에 병합합니다. 그런 다음 병합된 텍스트를 AI 에이전트에 전달합니다. AI 에이전트를 설정할 때는 올바른 프롬프트와 세션 ID를 설정해야 합니다. 기본적으로 AI 에이전트는 NAND의 기본 채팅 위젯에서 메시지를 수신할 것으로 예상하지만, 텔레그램을 사용하므로 텔레그램 트리거에서 채팅 ID를 매핑해야 합니다. 또한 AI 에이전트의 메모리를 설정하여 이전 메시지를 기억하도록 할 수 있습니다.
5. 음성 복제 및 텔레그램으로 응답 전송
AI 에이전트에서 응답을 생성한 후에는 Eleven Labs를 사용하여 텍스트를 음성으로 변환해야 합니다. Eleven Labs에는 NAND 통합 기능이 없으므로 HTTP 요청을 사용하여 Eleven Labs API와 직접 통합해야 합니다. Eleven Labs에서 음성 복제본을 만들려면 Eleven Labs 계정이 필요하며, 유료 플랜이 필요할 수도 있습니다. Eleven Labs API를 사용하려면 API 키와 음성 ID가 필요합니다. Eleven Labs API에 대한 HTTP POST 요청을 설정하고 API 키와 음성 ID를 헤더에 추가하고 텍스트를 본문에 추가합니다. 그런 다음 Eleven Labs에서 생성된 오디오 파일을 텔레그램으로 다시 전송합니다. 텔레그램으로 오디오 파일을 전송하려면 채팅 ID, 바이너리 파일, 파일 제목을 지정해야 합니다. 또한 JSON 데이터를 텔레그램으로 전송하기 전에 JSON.stringify() 함수를 사용하여 텍스트로 변환해야 합니다. 마지막으로, 생성된 음성 응답을 텔레그램을 통해 사용자에게 보냅니다.