75 lines
1.7 KiB
Markdown
Executable File
75 lines
1.7 KiB
Markdown
Executable File
# Gerador de Voz com Google Gemini API
|
|
|
|
Este projeto converte texto para áudio usando a Google Gemini API com tecnologia Text-to-Speech.
|
|
|
|
## Pré-requisitos
|
|
|
|
### 1. Instalar Dependências
|
|
```bash
|
|
pip install google-genai
|
|
```
|
|
|
|
### 2. Configurar API Key
|
|
|
|
Criar ficheiro `.env` na pasta do projecto:
|
|
```bash
|
|
cp .env.example .env
|
|
# Editar .env com a chave real
|
|
```
|
|
|
|
### 3. Executar o Projeto
|
|
|
|
#### Opcao 1 - Execucao Automatica (Recomendado):
|
|
```bash
|
|
chmod +x run_gemini_tts.sh
|
|
./run_gemini_tts.sh
|
|
```
|
|
|
|
#### Opcao 2 - Execucao Manual:
|
|
```bash
|
|
source .env
|
|
pip install google-genai
|
|
python gemini_tts.py
|
|
```
|
|
|
|
## O que o script faz
|
|
|
|
1. **Conecta à Gemini API** usando a chave configurada
|
|
2. **Processa o texto** sobre Marketing Digital da Descomplicar
|
|
3. **Gera áudio** usando a voz "Autonoe"
|
|
4. **Guarda ficheiros** WAV no diretório atual
|
|
|
|
## Configurações do Áudio
|
|
|
|
- **Modelo**: gemini-2.5-pro-preview-tts
|
|
- **Voz**: Autonoe (feminina, natural)
|
|
- **Formato**: WAV (conversão automática)
|
|
- **Qualidade**: 16-bit, 24kHz
|
|
|
|
## Ficheiros Gerados
|
|
|
|
O script cria ficheiros com nomes do tipo:
|
|
- `marketing_digital_audio_0.wav`
|
|
- `marketing_digital_audio_1.wav`
|
|
- etc.
|
|
|
|
## Personalização
|
|
|
|
Para alterar o texto ou configurações:
|
|
|
|
1. **Texto**: Editar a variável `text` na função `generate()`
|
|
2. **Voz**: Alterar `voice_name` (opções disponíveis na documentação Gemini)
|
|
3. **Nome dos ficheiros**: Modificar `file_name` no loop principal
|
|
|
|
## Uso Prático
|
|
|
|
Este gerador é ideal para:
|
|
- Criar conteúdo para podcasts
|
|
- Melhorar acessibilidade de conteúdos
|
|
- Produzir narração para vídeos
|
|
- Gerar áudio para e-learning
|
|
|
|
## Suporte
|
|
|
|
Para questões técnicas ou melhorias, contactar a equipa da Descomplicar.
|