Files
..

Gerador de Voz com Google Gemini API

Este projeto converte texto para áudio usando a Google Gemini API com tecnologia Text-to-Speech.

Pré-requisitos

1. Instalar Dependências

pip install google-genai

2. Configurar API Key

Criar ficheiro .env na pasta do projecto:

cp .env.example .env
# Editar .env com a chave real

3. Executar o Projeto

Opcao 1 - Execucao Automatica (Recomendado):

chmod +x run_gemini_tts.sh
./run_gemini_tts.sh

Opcao 2 - Execucao Manual:

source .env
pip install google-genai
python gemini_tts.py

O que o script faz

  1. Conecta à Gemini API usando a chave configurada
  2. Processa o texto sobre Marketing Digital da Descomplicar
  3. Gera áudio usando a voz "Autonoe"
  4. Guarda ficheiros WAV no diretório atual

Configurações do Áudio

  • Modelo: gemini-2.5-pro-preview-tts
  • Voz: Autonoe (feminina, natural)
  • Formato: WAV (conversão automática)
  • Qualidade: 16-bit, 24kHz

Ficheiros Gerados

O script cria ficheiros com nomes do tipo:

  • marketing_digital_audio_0.wav
  • marketing_digital_audio_1.wav
  • etc.

Personalização

Para alterar o texto ou configurações:

  1. Texto: Editar a variável text na função generate()
  2. Voz: Alterar voice_name (opções disponíveis na documentação Gemini)
  3. Nome dos ficheiros: Modificar file_name no loop principal

Uso Prático

Este gerador é ideal para:

  • Criar conteúdo para podcasts
  • Melhorar acessibilidade de conteúdos
  • Produzir narração para vídeos
  • Gerar áudio para e-learning

Suporte

Para questões técnicas ou melhorias, contactar a equipa da Descomplicar.