Gerador de Voz com Google Gemini API
Este projeto converte texto para áudio usando a Google Gemini API com tecnologia Text-to-Speech.
Pré-requisitos
1. Instalar Dependências
pip install google-genai
2. Configurar API Key
Criar ficheiro .env na pasta do projecto:
cp .env.example .env
# Editar .env com a chave real
3. Executar o Projeto
Opcao 1 - Execucao Automatica (Recomendado):
chmod +x run_gemini_tts.sh
./run_gemini_tts.sh
Opcao 2 - Execucao Manual:
source .env
pip install google-genai
python gemini_tts.py
O que o script faz
- Conecta à Gemini API usando a chave configurada
- Processa o texto sobre Marketing Digital da Descomplicar
- Gera áudio usando a voz "Autonoe"
- Guarda ficheiros WAV no diretório atual
Configurações do Áudio
- Modelo: gemini-2.5-pro-preview-tts
- Voz: Autonoe (feminina, natural)
- Formato: WAV (conversão automática)
- Qualidade: 16-bit, 24kHz
Ficheiros Gerados
O script cria ficheiros com nomes do tipo:
marketing_digital_audio_0.wavmarketing_digital_audio_1.wav- etc.
Personalização
Para alterar o texto ou configurações:
- Texto: Editar a variável
textna funçãogenerate() - Voz: Alterar
voice_name(opções disponíveis na documentação Gemini) - Nome dos ficheiros: Modificar
file_nameno loop principal
Uso Prático
Este gerador é ideal para:
- Criar conteúdo para podcasts
- Melhorar acessibilidade de conteúdos
- Produzir narração para vídeos
- Gerar áudio para e-learning
Suporte
Para questões técnicas ou melhorias, contactar a equipa da Descomplicar.