init: scripts diversos (crawlers, conversores, scrapers)

This commit is contained in:
2026-03-05 20:38:36 +00:00
commit 6ac6f4be2a
925 changed files with 850330 additions and 0 deletions

152
kb-processor/CHANGELOG.md Executable file
View File

@@ -0,0 +1,152 @@
# Registo de Alterações
[1.0.0] - 07-01-2025
Adicionado
- Instalao_Docker_TYPEBOT_no_EasyPanel-_HubConnect_20250107_023355.txt
- Typebot_no_WhatsApp_Aumente_Sua_Produtividade_com_a_Integrao_ao_Chatwoot_20250107_023412.txt
- Como_instalar_Evolution_API_2.0_no_Easypanel_[2024]_20250107_023258.txt
- Integrando_Evolution_API_com_ChatWoot_20250107_023339.txt
- Como_Integrar_o_Chatgpt_no_Chatbot_Whatsapp_com_Typebot_e_Chatwoot_20250107_023233.txt
[1.0.0] - 07-01-2025
Adicionado
- Chatwoot + Dify + n8n + Evolution API.pdf
## [1.2.0] - 07-01-2025
### Adicionado
- Documentação sobre o Chatwoot e suas funcionalidades
- Explicação detalhada sobre integração com WhatsApp e outras plataformas
- Informações sobre gestão de atendimento multicanal
## [1.3.0] - 07-01-2025
### Adicionado
- Chatbot AI integrado com Chatwoot
- Processador de chat com pesquisa na base de conhecimento
- Endpoint webhook para receber mensagens
- Documentação de configuração e uso do chatbot
## [1.4.0] - 07-01-2025
### Adicionado
- Sistema de distribuição inteligente de leads baseado em taxa de conversão
- Processador `LeadDistributor` para gestão automática de leads
- Exemplo de uso do sistema de distribuição
### Explorado
- Conceito de distribuição de leads baseada em performance
- Integração com base de conhecimento para pesquisa semântica
- Possibilidades de automação de atendimento
### Aprendido
- Estratégias de distribuição de leads por taxa de conversão:
- Vendedores com alta conversão recebem mais leads (120%)
- Vendedores na média recebem quota normal
- Vendedores com baixa conversão recebem menos leads (80%)
- Importância de manter consistência na comunicação com cliente
- Valor de produtos de entrada para atração de clientes
## [0.1.1] - 07-01-2025
### Alterado
- Atualização das dependências para melhor compatibilidade com Python 3.12
- Remoção da dependência langchain
- Flexibilização das versões das dependências
- Simplificação do requirements.txt
## [0.1.0] - 07-01-2025
### Adicionado
- Estrutura base do projeto
- Processador base para documentos
- Processador específico para PDFs
- Processador específico para ficheiros de texto
- Gerador de FAQs usando OpenRouter API
- Sistema de limpeza e normalização de texto
- Estruturação automática de conteúdo
- Integração com OpenRouter API (modelo deepseek)
- Sistema de metadados para documentos
- Formatação em Markdown
- Documentação inicial
- Configuração do ambiente virtual
- Gestão de dependências via pip
### Alterado
- Atualização da estrutura do projeto para seguir as diretrizes globais
- Configuração do ambiente virtual conforme padrões estabelecidos
### Corrigido
- Ajuste na configuração do ambiente virtual para usar .venv do diretório raiz
## [0.1.0] - 07-01-2025
Adicionado
- Novo escopo de projeto para sistema de gestão de conhecimento e automação digital.
- Interface para upload e processamento de conteúdos.
- Funcionalidades para extração de conteúdos de YouTube, páginas web, PDFs e pastas locais.
- Processamento automático com categorização, geração de FAQs e armazenamento em MD e JSON.
- Integração com OpenRouter e OpenAI para processamento de IA.
Alterado
- Estrutura de armazenamento para suportar novos tipos de conteúdos e organização hierárquica.
## [0.1.0] - 07-01-2025
Adicionado
- Novo escopo de projeto para sistema de gestão de conhecimento e automação digital.
- Interface para upload e processamento de conteúdos.
- Funcionalidades para extração de conteúdos de YouTube, páginas web, PDFs e pastas locais.
- Processamento automático com categorização, geração de FAQs e armazenamento em MD e JSON.
- Integração com OpenRouter e OpenAI para processamento de IA.
Alterado
- Estrutura de armazenamento para suportar novos tipos de conteúdos e organização hierárquica.
## [0.0.4] - 07-01-2025
### Adicionado
- Logs detalhados no processamento de vídeos do YouTube
- Sistema de monitoramento de progresso para transcrições
### Alterado
- Melhorias na extração de transcrições do YouTube
- Otimização do processamento de vídeos e playlists
### Corrigido
- Tratamento de erros na extração de transcrições
- Problemas com caracteres especiais no texto
## [0.0.3] - 07-01-2025
### Adicionado
- Suporte para processamento de URLs do YouTube
- Extração automática de transcrições
- Correção automática de texto
- Interface web básica para processamento
### Alterado
- Estrutura do projeto reorganizada
- Sistema de processamento modularizado
### Corrigido
- Problemas de codificação UTF-8
- Erros na extração de metadados
## [0.0.2] - 06-01-2025
### Adicionado
- Processamento básico de documentos
- Suporte inicial para PDF
- Suporte inicial para páginas web
### Alterado
- Estrutura inicial do projeto
- Sistema de processamento base
## [0.0.1] - 05-01-2025
### Adicionado
- Estrutura inicial do projeto
- Configuração básica do ambiente
- Documentação inicial