Files
scripts/kb-processor
ealmeida e7adb65d40 docs(okf): frontmatter OKF + rich abstracts nas descriptions
Normalizacao OKF dos .md: type/title/description/timestamp/layer +
descriptions factuais (rich abstracts). Apenas .md tracked; corpos intactos.
Parte da aplicacao OKF a /Dados/Dev (28-06-2026).

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
2026-06-28 22:55:40 +01:00
..

type, title, description, timestamp, layer
type title description timestamp layer
Reference Readme Sistema de processamento e gestão de conhecimento para o SuperBot 2025-07-03T03:47:22.866168+00:00 wiki

SuperBot Knowledge Base

Sistema de processamento e gestão de conhecimento para o SuperBot.

Funcionalidades

  • Processamento de URLs do YouTube

    • Extração automática de transcrições
    • Suporte para múltiplos idiomas
    • Correção automática de texto
    • Monitoramento de progresso em tempo real
    • Logs detalhados do processamento
  • Processamento de Documentos

    • PDFs
    • Páginas Web
    • Arquivos de Texto

Instalação

  1. Clone o repositório:
git clone https://github.com/descomplicar/superbot-kb.git
cd superbot-kb
  1. Crie e ative o ambiente virtual:
python -m venv .venv
source .venv/bin/activate  # Linux/Mac
  1. Instale as dependências:
pip install -r requirements.txt

Uso

Interface Web

  1. Inicie o servidor:
cd src/web
python -m uvicorn app:app --reload --host 0.0.0.0 --port 3000
  1. Acesse a interface em http://localhost:3000

API

  • POST /process-url: Processa uma URL do YouTube

    • Parâmetros: url (string)
    • Retorna: JSON com conteúdo processado
  • POST /process-file: Processa um arquivo

    • Parâmetros: file (multipart/form-data)
    • Retorna: JSON com conteúdo processado

Estrutura do Projeto

superbot-kb/
├── src/
│   ├── processors/      # Processadores de conteúdo
│   │   ├── youtube_processor.py
│   │   ├── pdf_processor.py
│   │   └── web_processor.py
│   └── web/            # Interface web
│       ├── app.py
│       └── templates/
├── data/               # Dados processados
├── logs/              # Logs do sistema
├── requirements.txt    # Dependências
└── README.md          # Documentação

Desenvolvimento

Logs e Monitoramento

O sistema agora inclui logs detalhados para:

  • Extração de IDs de vídeos
  • Obtenção de informações
  • Processamento de vídeos
  • Extração de transcrições
  • Correção de texto
  • Atualização de metadados

Próximos Passos

  1. Melhorar interface web
  2. Adicionar suporte para mais formatos
  3. Implementar processamento em lote
  4. Otimizar performance

Licença

Copyright 2025 Descomplicar - Agência de Aceleração Digital